天天看點

找不到完美資料科學家?你還可以組建一支資料科學夢之隊

找不到完美資料科學家?你還可以組建一支資料科學夢之隊

◆ ◆ ◆

導讀

提供洞察和分析的公司都在盡力為自己組建完美的資料科學團隊,這通常有兩條路可以走。

大部分公司都在掙紮中選擇了第一條路:尋找這些工資非常貴又很少見的獨角獸人才,即同時具備這多種技能的獨立個體。

完美的資料科學家完美地掌握了數學、統計學、程式設計以及溝通技術。這些人不光具備完成複雜工作的專業技術能力,還能夠向非技術人員解釋這些技術工作可能會帶來的影響。

除了這些資料科學家會很昂貴的事實之外,這些天才科學家一周7天,每天24小時連軸工作也是不太可能的。

當然這不是唯一的一條路。

找不到完美資料科學家?你還可以組建一支資料科學夢之隊

人類史上最早的科學家之一亞裡士多德曾經說過:“整體大于它的各部分之和”,這給了我們一些啟發。與其尋找這些很受歡迎的同時具備三方面技能的人,還不如挑選分别具備其中一項技能的人來組成一個團隊。畢竟,沒有一個人能夠永遠解決組織不斷增長的對資料科學研究的需求。它需要一個數學家來負責深入鑽研,還需要一個具備交叉學科知識的人來進行橫向整合,最終組成一個完美的團隊。

資料科學團隊的活力

任何一個資料科學團隊的終極目标就是要成為一個解決問題的機器,一個能在不斷變化的環境中不斷攪動出價值的團隊。越來越豐富的資料給曾經無法回答的業務問題提供了可能,這就給客戶對洞察複雜性的期待提升到了一個新的高度。但随着這一套連鎖反應而來的卻是沒有成熟方法論和解決方案的問題。随着輸入越來越多樣化,所需要的比對的技能同樣需要變得多樣化。“酷呆瓜”團隊的三個特點沒有一個是可以缺失的,是以這個團隊的集體智慧才真正是當今資料世界的驅動力。

顯然,完美資料科學家團隊中的任意兩塊都無法獨立于第三塊運作。而且,挖掘并保持資料科學家團隊的内部平衡才能帶來最大程度的準确性和相關性。

數學家/統計學家

這些受過訓練的學者在了解了相關理論以及結果所需要的條件後,基于這些輸入建構起先進的模型。

程式員

這位親自操刀的架構師負責清洗、管理以及修整資料,以及建造模拟器或其他高科技工具來使資料變得更加友善易用。

溝通者/内容專家

将技術翻譯為業務的專家利用自己的全局觀,基于過去的知識幫助尋找技術與使用者需求的連接配接點。

這些技能的互相支援才使得團隊變得完整,并具備完美的資料傳遞能力:

數學家/統計學家的工作嚴重依賴于程式員。“垃圾進入垃圾出去”的概念在這裡非常适用,也就是說如果程式員沒有清晰地擷取資料、管理資料,那麼科學家很難建構出有用的模型。此外,數學家和程式員又依賴于溝通者的知識。即便資料是完美的,也符合統計學結論,如果其無法直接涉及到要解決的商業問題,那麼這些就是沒有意義的。此外,内部不平衡的團隊将會面臨一些無法充實準備的困難,也無法傳遞出完美的作品。

今天的世界充滿了大量、高速的資料,企業都面臨着一個選擇。傳統那些寫代碼來編輯調查問卷、收集資料的程式員都被整合在了具備洞察的組織中。然而,他們中的很多人都沒有接受過數學或統計學的正統教育訓練。同樣地,那些面向客戶并具有數值定量頭腦的商務人才在團隊建構中也應當有一席之地。教育訓練現有數學或統計學人才是可行的,但漫長的過程需要極強的耐心。如果組織認可且相信他們已有的人才并且選擇這條路來組建團隊,這也就指向了需要填補的空白進而打造完美團隊。

組織機構很久之前就知道資料的價值了,但如果沒有人的參與,無論資料量有多大,細節有多深,到2019年實作資料科學300億美金的估值都是很難的。一個互相平衡的團隊對各類資料作出的解讀、過濾以及修正都會加速這種成長并提升資料科學的重要性。

許多人覺得hilary的“酷呆瓜”概念隻适用于個人。但實際上,我們必須認識到團隊的集體“酷”也是充滿潛力的。

當組織在組建和招聘資料科學團隊時,或許團隊宗旨可以簡單的稱為“如果你能找到呆瓜,那就留住他們。但如果缺少聚集了各類獨角獸人才的團隊,那就創造一個。”

 原文釋出時間為:2016-12-02

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀