La science des données est-elle une bulle?





Chez SkillFactory, en tant qu'école spécialisée dans la formation de data scientists et d'analystes de données, nous sommes attentifs à la question de la perception du métier lui-même, tant par les étudiants eux-mêmes que par leurs employeurs. Nous avons déjà parlé des exigences du métier d'analyste de données et de la confusion des postes vacants dans ce document , et nous souhaitons maintenant partager avec vous la traduction d'un article de la responsable du département de prise de décision intellectuelle chez Google, dans lequel elle parle des perspectives du poste de Data Scientist. À propos des risques de l'entreprise lors de l'embauche d'un Data Scientist en raison d'une compréhension différente du poste ou en raison de ressources humaines inexpérimentées et comment vous protéger des erreurs dans votre CV






La science des données est-elle une bulle? Vous seriez surpris de la fréquence à laquelle on me pose cette question. Ma réponse?



Probablement pas, mais la position du Data Scientist peut l'être.



Laissez-moi m'expliquer avant l'arrivée de la foule.



Data Scientist et la définition de la science des données



Les opinions sont nombreuses, mais je préfère la définition suivante: « La science des données est la discipline qui rend les données utiles». Si vous n'aimez pas ma définition, vous aimerez peut-être la définition claire de Harlan Harris:

La science des données est définie par ce que fait un Data Scientist et ce qu'il fait est très bien couvert ... Mais qui est un Data Scientist, peut-être une question plus fondamentale.



D'accord. Qui sommes-nous alors? Eh bien, cela dépend du club auquel vous appartenez. Et c'est là que l'idée de la bulle entre en jeu.



ET contre OU





Pour certaines personnes, le poste implique une pleine compétence dans trois spécialisations (statistiques, collecte de données, apprentissage automatique). Pour d'autres, cela signifie que les compétences de l'un sont combinées avec celles des autres. Cette compréhension différente du poste peut vous blesser lors de l'embauche.



Première option. Seuls les dignes!



Il y a ceux qui rêvent de dépouiller les imitateurs de leur travail et de limiter le métier sacré à une élite qui comprend tout sur les données.



Que ressentez-vous lorsque de telles personnes interviewent? Ils veulent me voir comme un statisticien pur-sang, avec une connaissance de l'apprentissage automatique, une ceinture noire en analytique et un portefeuille de projets appliqués. Ils veulent savoir si mon école doctorale était à la mode. Ils veulent tester comment j'étais un leader et comment j'ai résolu les problèmes commerciaux. Oh, et je ferais mieux d'avoir des compétences en communication. Et la lune sur un bâton? Si je n'avais pas fait de data depuis l'âge de huit ans, j'aurais été terrifiée. Jusque-là, c'est un petit club amusant pour lequel j'ai des sentiments profondément contradictoires.



Laisse-moi l'appeler comme ça: Club Et... Les participants doivent être des statisticiens compétents, des experts en apprentissage automatique et des analystes ayant des compétences en codage de bijoux. Veuillez noter que l'entrée dans ce club est assez difficile; peu de gens sont des experts sur toutes les questions de données. Ces personnes ne pourront jamais répondre aux besoins mondiaux en spécialistes. Malheureusement, c'est la nature de l'offre et de la demande.



Option deux. Les portes sont ouvertes à tous!



Un club alternatif et beaucoup plus fréquenté est le club OR . Il s'agit de personnes qui ont renommé leur fonction, comme analyste ou statisticien, en un terme générique. Sonne mieux, augmente l'emploi dans la science des données, élargit la communauté, apporte une variété de compétences. Tout le monde y gagne. Droite? Presque.



Ce que j'aime: Il met l'accent sur l'équipe, la nature athlétique de la science des données et cette approche permet à plus de gens de participer à la science des données. Excellent! Et certains domaines de la science des données ne sont pas si difficiles. L'exploration de données, c'est-à-dire la collecte de données, est un domaine dans lequel les gens sont plus qualifiés qu'ils ne le pensent. Si vous pensiez que la collecte de données nécessitait un doctorat, j'ai de bonnes nouvelles. Tout ce dont vous avez besoin est de comprendre comment examiner les ensembles de données, d'humilité modérée et de bon sens.



Qu'en est-il de l'autre côté? La science des données est réputée pour ses exigences élevées et sa longue immersion dans l'apprentissage. Je sympathise profondément avec les gestionnaires d'embauche pauvres et déconcertés qui pensent attirer un spécialiste polyvalent mais embauchent quelqu'un de beaucoup moins qualifié. La fausse publicité est dommageable.



Conseil: Si vous voulez être assuré de ne pas exagérer sur votre CV, un poste d'analyste de données est l'option la plus sûre.



Fausse pub



Pour être honnête, chaque fois que je suis devenu Data Scientist, j'ai fait le même travail qu'avant, à des postes qui étaient nommés différemment. Lorsque les «gestionnaires efficaces» ont de nouveau changé leur titre de poste, mes responsabilités n'ont pas changé du tout.



Je ne suis pas une exception. J'ai beaucoup d'ex- statisticiens, d'ingénieurs d'aide à la décision, d'analystes quantitatifs, de professeurs de mathématiques, de scientifiques du big data, d'analystes d'affaires, d'analystes de premier plan, de chercheurs, d'ingénieurs logiciels, de docteurs ... tous fiers de nos jours. scientifiques.



Quand je suis devenu Data Scientist, mes responsabilités n'ont pas du tout changé.



Amis, je ne juge pas. Gérez bien votre marque personnelle. Mais je tiens à souligner que la définition de la science des données basée sur le concept de "Data Scientist" n'est pas très précise, étant donné à quel point la foule attire le nom. En prenant la limite, nous obtenons un ensemble de mots soigneusement conçus pour en dire le moins possible. Cela se reflète dans la façon dont le Data Scientist est perçu. J'ai récemment ressenti un pic de pression lorsqu'un responsable du recrutement en science des données a publié quelque chose comme «Avez-vous un doctorat? Alors vous êtes probablement un Data Scientist . " Reformulé pour protéger les innocents.



Utiliser les titres de poste pour définir la science des données est un jeu dangereux.



Les data scientists bien connus savent déjà ce qu'ils recherchent et peuvent trouver un bon, euh, Data Scientist, même si le titre du poste indique un extraterrestre de l'espace . Je m'inquiète des recruteurs moins expérimentés. De nombreuses entreprises qui se lancent dans la science des données n'ont pas l'expertise pour les aider. Leur plan? Engagez un Data Scientist et tout ira bien.



Attention à ceux qui paient



Mettez-vous dans la peau d'un nouveau responsable du recrutement: vous avez beaucoup lu et avez décidé que vous aviez besoin de compétences en statistiques, en exploration de données et en apprentissage automatique pour votre projet. Vous pouvez embaucher trois personnes. Regardons maintenant les candidats: 10 CV intitulés "Data Scientist".



S'il s'agit de personnes du club I , vous pouvez choisir trois CV. Chaque candidat possède les compétences dont vous avez besoin. Malheureusement, ce club est petit (lire: très cher à embaucher ), il y a donc de bonnes chances que ces 10 personnes ne soient pas membres du I. Il



peut être difficile pour le responsable du recrutement de déterminer dans quelle partie de la science des données un candidat est vraiment bon.



Si ce sont des personnes OU(ce qui est plus probable dans l'environnement actuel), vous devez les interroger attentivement pour savoir dans quoi ils sont vraiment qualifiés. Vous avez besoin de trois ensembles de compétences différents. Les gens en face de vous n'en ont peut-être qu'un, mais ils ont également tout intérêt à vous convaincre qu'ils sont universels. Ils peuvent avoir un minimum de connaissances sur les trois domaines (statistiques, collecte de données, apprentissage automatique). Cela peut être dangereux pour votre projet et votre embauche. Vous devez savoir dans quoi ils sont vraiment bons, ce qui peut être délicat à moins que vous ne soyez un data scientist chevronné avec une variété de formations.



Résultat? Erreurs lors de la candidature à un emploi. Les mots à la mode CV ne sont pas une garantie de compétences réelles.


J'ai vu de nombreuses équipes demander accidentellement à plusieurs analystes de collecter des données au lieu d'un groupe diversifié. Mais ce n'est pas seulement un problème de science des données. Il s'avère que les mots à la mode sur un CV ne sont pas nécessairement accompagnés de garanties de compétences. Plus le mot à la mode est chaud, plus il se propage.



Est-ce la fin de l'analyse des données?



Personnellement, je traite les titres de poste avec un grain de sel. Il est important que les compétences correspondent à tous les besoins de l'entreprise. Si le titre du poste n'est pas un bon indicateur, les responsables du recrutement qualifiés apprendront à chercher autre chose sur leur CV.



Perdu dans mes pensées, je peux même prévoir l'histoire du club OR . La position peut simplement sortir du style, mais je ne suis pas du genre à suivre.



La science des données est-elle une bulle ou pas?



Plus de données dans le monde signifie plus de demande pour les trois principales activités de science des données - inférence statistique, apprentissage automatique, analyse / collecte de données - de sorte que ces compétences resteront très pertinentes malgré leurs noms, qui peuvent changer. Vous pouvez toujours gagner votre vie en extrayant de la valeur des données.



D'un autre côté, les équipes qui ont été embauchées sur le battage médiatique et qui n'ont jamais appris à se concentrer sur ce qui est précieux pour l'entreprise peuvent constater que leur temps presse.



Il y a quelques années, un de mes amis, un CTO qui travaille dans le domaine de la technologie, s'est plaint de ses scientifiques de données inutiles. «Je pense que vous pourriez engager des data scientists comme un baron de la drogue achète un tigre pour son domaine», lui ai-je dit. "Vous ne savez pas ce que vous attendez d'un tigre, mais tous les autres barons de la drogue en ont un."



Je ne connais pas les vrais barons de la drogue (ou les tigres), donc je ne sais pas ce qu'ils ont sur leurs terres. Mais tu me comprends.



Bien que la science des données ressemble à une bulle, je suis en fait optimiste. Le volume croissant de données signifie des opportunités croissantes. Tout cela nécessite une bonne gestion. Un de mes amis, par exemple, a fini par résoudre plusieurs de ses problèmes en réalisant, avec l'aide d'analystes de données, qu'une partie de son organisation avait besoin de formation. Depuis, ses équipes sont devenues plus réfléchies sur la façon de répartir le travail. De grandes choses ont commencé. Enseigner aux décideurs comment utiliser la science des données a sauvé la mise!



Assurez-vous que les décideurs ont les bonnes compétences pour le poste. Si une bulle existe, cela pourrait être sa racine.


Le défi pour les leaders de la science des données d'aujourd'hui est d'aider les décideurs à suivre ce type de formation. Cela créera davantage de personnes capables de mettre en valeur le talent technique du Data Scientist dans des directions précieuses. En savoir plus ici . Une fois que les data scientists apportent de la valeur, leur contenu devient une nécessité, pas un problème de mode. Peut - on traiter les problèmes avant que le scientifique des données travail perd la popularité et le changement de marque commence?






Dans nos cours, nous analysons en permanence le marché et donnons aux étudiants les compétences réelles qui leur permettront de rester professionnellement en demande pendant longtemps. Et afin de présenter correctement les compétences acquises, nous travaillons avec le CV et le portfolio du diplômé.



image






E







All Articles