天天看點

因職業角色而異的十大資料科學技能

資料科學的實踐需要三個一般領域的技能:商業洞察、計算機技術/程式設計和統計學/數學。與詢問對象有關,具體的重要技能集合總是在變化。dave holts描述了得到資料科學家工作所需要的技能,ferris jumah通過檢查帶有“資料科學家”稱号的linkedin個人資料識别10項技能,burtchworks提供了他們的在資料科學領域中獲得成功至關 重要的技能清單,rjmetrics也使用linkedin資料找出了20個重要的資料科學技能。這些清單、重要技能反映了資料專業人員在他們社交媒體資 料上列出的頻率,或者隻是簡單地代表了作者認為最好的技能集合。

資料科學技能和熟練程度

因職業角色而異的十大資料科學技能

在正在進行的資料科學家研究中,我們要求資料專業人員指出他們在25項不同資料科學技能上的熟練程度。上表中列出了這25項技能,反映了通常與資料科學家相關的技能集合。事實上,這些技能是前述研究中所包含的。

我用“中等”熟練水準作為資料專業人員擁有該技能的标準。“中等”說明一個資料專業人員能夠按照要求完成任務,并且通常不需要他人的幫助。

因職業角色而異的十大資料科學技能

重要資料科學技能

我以擁有該技能的資料專業人員百分比對這25項技能排序。

該清單在上圖顯示。圖中前十項技能(從左到右)是所有資料專業人員中最常見的。資料科學十大技能是:

統計 – 溝通(87%)

技術 – 處理結構化資料(75%)

數學&模組化 – 數學(71%)

商業 – 項目管理(71%)

統計 – 資料挖掘和可視化工具(71%)

統計 – 科學/科學方法(65%)

統計 – 資料管理(65%)

商業 – 産品設計和開發(59%)

統計 – 統計學和統計模組化(59%)

商業 – 商業開發(53%)

許多重要的資料科學技能屬于統計領域:所有的五項統計相關技能出現在前10名中,包括溝通、資料挖掘和可視化工具、科學/科學方法、以及統計學和統計模組化。另外,商業洞察力相關的三項技能出現在前10,包括項目管理、産品設計以及開發。沒有程式設計技能出現在前10中。

因職業角色而異的十大資料科學技能

下面,我們按不同的職業角色看看他們的十大技能。這種描述也出現在上一部分的圖2中(後面的表呈現了細節)。對于每個職業角色,我指出了該角色的數 據專業人士擁有每項技能的頻率。可以看到在圖2中,一些重要資料科學技能在不同角色中是通用的。這包括溝通、管理結構化資料、數學、項目管理、資料挖掘和 可視化工具、資料管理、以及産品設計和開發。然而,除了這些相似之處還有相當大的差異,讓我們看看每個職業角色。

商業經理:那些認為自己是商業經理(尤其是上司者、商務人士和企業家)的資料專業人士中的十大資料科學技能:

統計 – 溝通(91%)

商業 – 項目管理(86%)

商業 – 商業開發(77%)

技術 – 處理結構化資料(74%)

商業 – 預算(71%)

商業 – 産品設計和開發(70%)

數學&模組化 – 數學(65%)

統計 – 資料管理(64%)

統計- -資料挖掘和可視化工具(64%)

商業 – 管理和相容性(61%)

隻與商業經理相關的重要技能毫無疑問的是商業領域的。這些技能包括商業開發、預算、以及管理和相容性。

開發工作者:那些認為自己是開發工作者(尤其是開發者和工程師)的資料專業人士中的十大資料科學技能:

技術 – 管理結構化資料(91%)

統計 – 溝通(85%)

統計 – 資料挖掘和可視化工具(76%)

商業 – 産品設計(75%)

數學&模組化 – 數學(75%)

統計 – 資料管理(75%)

商業 – 項目管理(74%)

程式設計 – 資料庫管理(73%)

程式設計 – 後端程式設計(70%)

程式設計 – 系統管理(65%)

隻與開發者相關的技能是技術和程式設計的那些。這些重要的技能包括後端程式設計、系統管理以及資料庫管理。雖然這些資料資料專業人員具備這些技能,但是他們 中隻有少數人擁有那些在大資料世界中很重要的,更加技術化、更加依賴程式設計的技能。例如,少于一半人掌握雲管理(42%),大資料和分布式資料(48%)和 nlp以及文本挖掘(42%)。這些結果都與rj metrics的資料科學研究一緻。我懷疑這些百分比會随着更多資料科學項目的畢業生開始就業而上升。

創意工作者:那些認為自己是創意工作者(尤其是萬事通、藝術家和黑客)的資料專業人士中的十大資料科學技能:

技術 – 處理結構化資料(79%)

商業 – 項目管理(77%)

統計 – 資料挖掘和可視化工具(77%)

商業 – 産品設計和開發(68%)

統計 – 科學/科學方法(68%)

統計 – 資料管理(67%)

統計 – 統計學和統計模組化(63%)

商業 – 商業開發(58%)

創意工作者并沒有隻對他們重要的技能。事實上,他們的重要資料科學技能清單與那些研究者緊密比對,十項中有八項一緻。

研究工作者:那些認為自己是研究工作者(尤其是研究員、科學家和統計學家)的資料專業人士中的十大資料科學技能:

統計 – 溝通(90%)

統計 – 資料挖掘和可視化工具(81%)

數學&模組化 – 數學(80%)

統計 – 科學/科學方法(78%)

統計 – 統計學和統計模組化(75%)

技術 – 處理結構化資料(73%)

統計 – 資料管理(69%)

商業 – 項目管理(68%)

技術 – 機器學習(58%)

數學 – 最優化(56%)

研究工作者的重要資料科學技能主要在統計領域。另外,隻在研究工作者上展現的重要資料科學技能是高度定量性質,包括機器學習和最優化。

總結和結論

因職業角色而異的十大資料科學技能

按職業角色的重要資料科學技能

重要資料科學技能清單取決于你正在考慮成為的資料科學家類型。雖然一些技能看起來在不同專業人士間通用(尤其是溝通,處理結構化資料,數學,項目管 理,資料挖掘和可視化工具,資料管理,以及産品設計和開發),但是其他資料科學技能對特定領域也有獨特之處。開發工作者的重要技能包含程式設計技能;研究工作 者則包含數學相關的技能,當然商業經理的重要技能包含商業相關的節能。

這些結果對資料專業人員感興趣的領域和他們的招聘者及組織都有影響。資料專業人員可以使用結果來了解不同類型工作需要具備的技能種類。如果你有較強的統計能力,你可能會尋找一個有較強研究成分的工作。了解你的技能并找那些對應的工作。

招聘人員需要了解不同類型的資料科學角色,以更好的招募與空缺職位的角色需求最比對的專業人員。避免關注應聘者的職位,而是确定他們的技能符合要求。組織可以確定資料科學團隊包含不同類型的資料科學家,讓每個人解決最合适的問題,以此來優化他們的資料科學團隊。

本文作者:數藝智訓翻譯

來源:51cto

繼續閱讀