Comment embaucher un scientifique des données

Publié: 2022-04-28

Avec l'abondance toujours croissante de données désormais disponibles, les entreprises se concentrent sur l'analyse des données - et une demande féroce de Data Scientists est apparue.

Les rôles des Data Scientists ont augmenté de 650 % depuis 2012, ce qui n'est pas surprenant compte tenu du retour sur investissement. Les entreprises qui comprennent comment utiliser les données pour prendre des décisions devraient prendre 1,2 billion de dollars à leurs concurrents d'ici 2020.

Mais il existe toujours un large fossé entre les entreprises qui utilisent efficacement les données et celles qui ne le font pas. Une étude Forrester de 2016 a révélé que seulement 22 % des entreprises étaient considérées comme des « Insights Leaders » – des entreprises qui utilisent la science des données pour un avantage concurrentiel – et que ces entreprises étaient deux fois plus susceptibles d'occuper une position de leader sur le marché.

Pour rejoindre ceux qui sont en tête du peloton, vous devrez non seulement embaucher un Data Scientist, mais le bon Data Scientist, et avec cette demande susmentionnée pour leurs services, ce ne sera peut-être pas si facile. Jeremy Stanley, Chief Data Scientist et EVP Engineering chez Sailthru , estime que l'embauche à elle seule peut facilement consommer 20 % ou plus du temps d'une équipe Data Science.

Pour assurer un processus plus efficace, voici quelques conseils sur ce qu'il faut demander et ce qu'il faut rechercher.

Sachez ce que vous voulez

Cela semble simple, mais c'est une triste réalité que trop d'organisations embauchent des Data Scientists sans d'abord considérer leurs objectifs.

Le processus d'embauche doit refléter les besoins spécifiques de votre équipe. Votre candidat sera-t-il principalement responsable de la création de visualisations et de tableaux de bord attrayants pour les non-analystes, de la conception et du développement de réseaux neuronaux profonds et de modèles d'apprentissage automatique, ou du prototypage d'applications réelles ?

L'embauche d'un Data Scientist dont les forces ne correspondent pas aux besoins de votre entreprise ne fonctionnera pas bien pour l'une ou l'autre des parties. Construire une feuille de route de données réaliste avant de commencer le processus est crucial.

Développer un processus pratique

Interviewer des Data Scientists peut être un processus délicat car, comme nous l'avons mentionné, vos candidats ont des options. Stanley de Sailthru a souligné que les bons candidats dans le domaine peuvent souvent recevoir trois offres ou plus, et que les taux de réussite à l'embauche des gestionnaires sont généralement inférieurs à 50 %.

C'est quelque chose à considérer à chaque étape du processus d'embauche, et bien que vous souhaitiez être minutieux, il est tout aussi crucial de ne pas effrayer les candidats potentiels.

Considérez, par exemple, le test à domicile qui est une étape préliminaire dans le processus d'embauche pour la plupart des organisations. Si un candidat est en demande et déjà potentiellement recherché par plusieurs autres entreprises – et probablement déjà employé en premier lieu – alors il ou elle sera peu incité à accomplir une mission inutilement ardue qui nécessite des jours de travail.

Riley Newman, ancien responsable de l'analyse chez Airbnb, a déclaré que l'entreprise s'est contentée de proposer un "défi de données de base" à cette étape du processus, plutôt que quelque chose de trop exigeant.

"Le but ici est de valider la capacité du candidat à travailler avec des données, comme décrit dans son CV", écrit -il . « Nous leur envoyons quelques ensembles de données et leur posons une question de base ; l'exercice devrait être facile pour quiconque a de l'expérience.

Lorsque les candidats sont finalement amenés à relever un défi plus rigoureux, cela doit être considéré non seulement comme une opportunité de tester leurs compétences, mais aussi pour montrer ce qui rend votre entreprise spéciale. Rappelez-vous : le processus de ressenti fonctionne dans les deux sens.

"Nous essayons d'être aussi transparents que possible sur (notre défi de données internes)", a déclaré Newman. « Vous voyez ce que c'est que de travailler avec nous et vice versa. Nous demandons donc au candidat de s'asseoir avec l'équipe, de lui donner accès à nos données et de lui poser une question générale. Ensuite, ils ont la journée pour s'attaquer au problème comme bon leur semble, avec le soutien des personnes qui les entourent.

"Nous encourageons les questions, déjeunons avec eux pour apaiser la tension et vérifions périodiquement qu'ils ne sont pas bloqués sur quelque chose d'insignifiant."

Posez les bonnes questions

Parfois, les responsables du recrutement sont tentés d'utiliser l'entretien pour approfondir les moindres détails de l'ensemble de compétences techniques d'un candidat, bombardant la personne interrogée de questions sur un large éventail de compétences qui pourraient même ne pas être pertinentes pour le poste à pourvoir. C'est une erreur. Limitez vos questions aux outils que vous utilisez réellement, puis faites un suivi en étudiant comment un candidat appliquerait ces outils à un problème spécifique.

Pour avoir une meilleure idée de la façon dont votre futur Data Scientist pense, demandez-lui d'expliquer un problème récent qu'il a entrepris de résoudre. Demandez comment ils ont abordé le projet – et pourquoi ils ont fait les choix qu'ils ont faits – et comment ils ont déterminé comment allouer leur temps et leurs ressources. Enfin, demandez-leur ce qu'ils ont appris du projet – et ce qu'ils feraient différemment.

En plus de vous donner une fenêtre sur le processus du candidat, cela vous donnera également un aperçu de s'il possède ou non une compétence non technique qui peut être cruciale pour les Data Scientists : la capacité de narration.

Lorsque la situation exige un examen plus approfondi des prouesses techniques du candidat, la scientifique des données Jacqueline Nolis recommande de garder les questions relativement basiques. Par exemple, si elle sonde les connaissances d'un candidat en statistiques, elle suggère de demander comment expliquer une régression linéaire à un dirigeant d'entreprise, ou si la personne interrogée peut énumérer des modèles alternatifs à une régression linéaire et expliquer pourquoi ils sont meilleurs ou pires.

"Étant donné un domaine particulier, je ne pose que des questions à un niveau d'introduction. Par exemple, si je posais une question sur les modèles d'apprentissage automatique, je poserais uniquement des questions sur les régressions linéaires et logistiques et éviterais de poser des questions sur des sujets plus avancés comme les forêts aléatoires ou le boosting », a-t-elle écrit. "La raison en est que s'ils comprennent les bases, ils devraient être en mesure d'aborder les sujets avancés sur le tas."

Avant même d'en arriver là, Nolis conseille de demander d'abord au candidat s'il connaît bien le sujet.

"S'ils disent qu'ils n'ont pas grand-chose, je saute", a-t-elle déclaré. "Je veux éviter que le candidat ne se sente dépassé ou frustré par ce sujet, car cela pourrait compromettre le reste de l'entretien."

Recherchez ces compétences et qualifications

Le diagramme de Venn classique pour les scientifiques des données a toujours établi que leurs compétences se situaient au carrefour des affaires, de l'informatique et des mathématiques. Bien que cela soit largement vrai, tous les rôles n'exigent pas une maîtrise de la stratégie, de l'ingénierie et de la modélisation mathématique. Donc, encore une fois, il est préférable d'approfondir les besoins spécifiques du poste que vous occupez.

Néanmoins, les compétences techniques générales que les Data Scientists doivent principalement posséder peuvent être divisées en trois catégories :

  • Pour collecter et stocker des données avec des bases de données, Excel et des langages d'interrogation tels que XML et SQL
  • Pour analyser et modéliser des ensembles de données à l'aide d'outils tels que Python, R, Hadoop et Spark
  • Pour créer des visualisations attrayantes et perspicaces à l'aide d'outils tels que Tableau et PowerBL

Bien qu'il soit vrai que tous les scientifiques des données n'ont pas besoin de maîtriser tous les aspects du rôle, ces aptitudes et compétences sont quasi universellement souhaitées.

En fait, Michael Li, un scientifique des données qui a travaillé chez Google et Foursquare, a déploré qu'un trop grand nombre de personnes qui se disent scientifiques des données soient vraiment des "cliqueurs", à l'aise uniquement avec des outils pointer-cliquer pour l'analyse et la visualisation des données.

"Il est temps d'embaucher des Data Scientists capables de coder avec des outils plus puissants, comme R, Python et TensorFlow", a écrit Li . "Et les entreprises devraient envisager de former leur main-d'œuvre existante aux compétences en science des données et en IA afin d'enseigner aux cliqueurs certaines des compétences dont ils auront besoin pour devenir codeurs."

Néanmoins, il est important de ne pas négliger la valeur des compétences moins techniques comme la créativité, la pensée critique et le sens des affaires.

Sara Vera, Data Scientist chez Insightly , suggère que la meilleure approche consiste à embaucher des talents en Data Science et à envoyer vos employés suivre des programmes de formation supplémentaires si nécessaire.

"La pensée analytique et les compétences en communication sont plus difficiles à enseigner que SQL, Python et R", a-t-elle écrit . "L'avantage supplémentaire de la formation aux compétences techniques est que vous créez un environnement où le mentorat est vraiment fort, ce qui crée une équipe plus cohésive. De toute façon, les meilleurs candidats voudront toujours apprendre les uns des autres.

Offrir des salaires compétitifs

Enfin, il convient de noter que les spécialistes aussi demandés que les Data Scientists ne sont pas bon marché ; Glassdoor répertorie le salaire moyen d'un Data Scientist aux États-Unis à 139 840 $ par an.

Après ce long processus, assurez-vous de ne pas perdre votre précieux candidat à cause d'une offre de salaire modeste. Rappelez-vous : il ou elle a probablement des options.

Icône

Apprenez des compétences en matière de données pour dynamiser votre carrière - depuis chez vous !

BrainStation propose des cours de certificat en ligne en direct sur la science des données, l'analyse de données, l'apprentissage automatique et la programmation Python. Assistez à des cours en direct et interagissez avec des instructeurs et des pairs de partout dans le monde.

Parlez à un conseiller en apprentissage