如何聘請數據科學家

已發表: 2022-04-28

隨著現在可用的數據越來越豐富,公司正專注於數據分析——對數據科學家的強烈需求已經出現。

自 2012 年以來,數據科學家的職位增加了 650%,考慮到投資回報率,這並不奇怪。 預計到 2020 年,了解如何使用數據來推動決策的企業將從競爭對手那裡獲得 1.2 萬億美元。

但是,有效使用數據的公司與未有效使用數據的公司之間仍然存在很大差距。 Forrester 2016 年的一項研究發現,只有 22% 的公司被認為是“洞察力領導者”——利用數據科學獲得競爭優勢的公司——而這些公司處於市場領先地位的可能性是其兩倍。

要加入最前沿的行列,您不僅需要聘請數據科學家,還需要聘請合適數據科學家,並且鑑於上述對他們服務的需求,這可能並不那麼容易。 Sailthru首席數據科學家兼工程執行副總裁 Jeremy Stanley估計,僅招聘一項就很容易消耗數據科學團隊 20% 或更多的時間。

為了確保更有效的流程,這裡有一些關於要問什麼以及要尋找什麼的提示。

知道你想要什麼

這聽起來很簡單,但不幸的是,太多的組織在沒有首先考慮他們的目標的情況下僱傭數據科學家。

招聘過程應反映您團隊的具體需求。 您的候選人是否主要負責為非分析人員創建引人入勝的可視化和儀表板、設計和開發深度神經網絡和機器學習模型,或者為實際應用程序製作原型?

僱用一個優勢與公司需求不相符的數據科學家對任何一方都不利。 在開始這個過程之前建立一個現實的數據路線圖是至關重要的。

制定一個實際的過程

面試數據科學家可能是一個棘手的過程,因為正如我們所提到的,您的候選人有選擇權。 Sailthru 的斯坦利指出,該領域的優秀候選人通常可以獲得三個或更多的報價,而經理的招聘成功率通常低於 50%。

這是在招聘過程的每個階段都需要考慮的事情,雖然你會想要徹底,但同樣重要的是不要嚇跑潛在的候選人。

例如,考慮一下帶回家的測試,它是大多數組織招聘過程中的初步步驟。 如果候選人有需求並且已經被其他幾家公司潛在地追求——並且可能首先已經被雇用——那麼他或她將沒有動力完成一項需要數天工作的不必要的艱鉅任務。

Airbnb 前分析主管 Riley Newman 表示,該公司只是在流程的這一步提出了“基本數據挑戰”,而不是任何太苛刻的要求。

“這裡的目標是驗證候選人處理數據的能力,如簡歷中所述,”他寫道 “我們向他們發送了一些數據集並提出了一個基本問題; 對於任何有經驗的人來說,這個練習應該很容易。”

當候選人最終接受更嚴格的挑戰時,不僅應將其視為測試其技能的機會,還應將其視為展示貴公司與眾不同之處的機會。 請記住:感受過程是雙向的。

“我們試圖對(我們的內部數據挑戰)盡可能透明,”紐曼說。 “你會看到與我們合作的感覺,反之亦然。 所以我們讓候選人和團隊坐在一起,讓他們訪問我們的數據,並提出一個廣泛的問題。 然後,他們有時間在周圍人的支持下,以他們的意願解決問題。

“我們鼓勵提問,與他們共進午餐以緩解緊張情緒,並定期檢查以確保他們不會被瑣碎的事情困擾。”

提出正確的問題

有時,招聘經理很想利用面試來深入了解候選人技術技能的每一個細節,向他們的面試者詢問可能與手頭工作無關的廣泛能力。 這是一個錯誤。 將您的問題限制在您實際使用的工具上,然後通過調查候選人如何將這些工具應用於特定問題來跟進。

為了更好地了解您未來的數據科學家的想法,請他們解釋他們打算解決的最近的一個問題。 詢問他們是如何處理這個項目的——以及他們為什麼做出這樣的選擇——以及他們如何決定如何分配他們的時間和資源。 最後,詢問他們從項目中學到了什麼——以及他們會採取哪些不同的做法。

除了讓您了解候選人的流程之外,這還將讓您深入了解他們是否擁有對數據科學家至關重要的軟技能:講故事的能力。

當情況確實需要更深入地了解候選人的技術實力時,數據科學家 Jacqueline Nolis建議保持相對基本的問題。 例如,如果調查候選人的統計知識,她建議詢問如何向業務主管解釋線性回歸,或者受訪者是否可以列出線性回歸的一些替代模型並解釋為什麼它們更好或更差。

“對於一個特定的領域,我只提出介紹性的問題。 例如,如果問一個關於機器學習模型的問題,我只會問線性和邏輯回歸,避免問更高級的話題,比如隨機森林或提升,”她寫道。 “這樣做的原因是,如果他們了解基礎知識,他們應該能夠在工作中學習高級主題。”

甚至在達到這一點之前,諾利斯建議先詢問候選人他們對該主題的熟悉程度。

“如果他們說他們沒有太多,我會跳過它,”她說。 “我想避免讓候選人對這個話題感到不知所措或沮喪,因為這可能會危及面試的其餘部分。”

留意這些技能和資格

數據科學家的經典維恩圖一直將他們的技能組合與商業、計算機科學和數學聯繫在一起。 雖然這在很大程度上是正確的,但並非所有角色都需要掌握戰略、工程和數學建模。 因此,最好再一次深入了解您正在填補的職位的具體需求。

儘管如此,數據科學家最需要具備的一般技術技能可以分為三類:

  • 使用數據庫、Excel 和查詢語言(如 XML 和 SQL)收集和存儲數據
  • 使用 Python、R、Hadoop 和 Spark 等工具分析和建模數據集
  • 使用 Tableau 和 PowerBL 等工具創建引人入勝且富有洞察力的可視化

儘管並非每個數據科學家都需要掌握角色的所有方面,但這些技能和能力幾乎是普遍需要的。

事實上,曾在 Google 和 Foursquare 工作過的數據科學家 Michael Li 感嘆,太多自稱數據科學家的人實際上是“點擊者”,只對用於數據分析和可視化的點擊工具感到滿意。

“現在是時候聘請能夠使用 R、Python 和 TensorFlow 等更強大工具進行編碼的數據科學家了,”李寫道 “公司應該考慮對現有員工進行數據科學和人工智能技能培訓,以便向點擊者教授他們成為程序員所需的一些技能。”

儘管如此,重要的是不要忽視創造力、批判性思維和商業意識等技術性較低的技能的價值。

Insightly數據科學家 Sara Vera建議,最好的方法是聘請數據科學人才,並根據需要派遣員工參加額外的培訓計劃。

“分析思維和溝通技巧比 SQL、Python 和 R 更難教授,”她寫道 “技術技能培訓的額外好處是,您可以創造一個指導非常強大的環境,從而創建一個更具凝聚力的團隊。 無論如何,最好的候選人總是希望互相學習。”

提供有競爭力的薪水

最後,值得注意的是,像數據科學家這樣受歡迎的專家並不便宜。 Glassdoor 列出了美國數據科學家的平均年薪為 139,840 美元。

在這個漫長的過程之後,請確保不要因為低薪而失去您珍貴的候選人。 請記住:他或她可能有選擇。

圖標

在家學習數據技能以提升您的職業生涯!

BrainStation 提供數據科學、數據分析、機器學習和 python 編程方面的在線實時證書課程。 參加現場課程並與來自世界各地的講師和同伴互動。

與學習顧問交談