天天看點

資料科學家可能成為2015年最熱門職業

[摘要]招聘網站報告稱,資料科學家的平均年薪為11.9萬美元,而程式員的平均年薪為6.5萬美元,差距由此可見。

你擅長數學,會用python程式設計,而且還對某個行業了如指掌?如果你擁有這樣的技能集,那你就有可能當上資料科學家。而如果你當上了資料科學家,那你的日子就可以過得風風光光了——linkedin的最新投票結果顯示,“統計分析和資料挖掘” 是2014年最大的求職法寶。

美國招聘網站glassdoor的報告稱,資料科學家的平均年薪為118709美元(約合人民币737550元),而程式員的平均年薪為64537美元(約合人民币400974元)。麥肯錫公司的一份研究預測稱,到2018年,在“具有深入分析能力的人才”方面,美國可能面臨着14萬到19萬的缺口,而“可以利用大資料分析來做出有效決策的經理和分析師” 缺口則會達到150萬。

該領域目前異常火爆,紐約大學資料科學中心課程的負責人羅伊-洛倫斯(roy lowrance)表示,現在可能已經到了巅峰期。“也許存在着泡沫,” 他說。 “無論什麼事情,一旦變得這樣火爆,之後就肯定就會冷下來。”不過,紐約大學希望在未來幾年裡擴大資料科學課程的招生規模,把學生人數從40名增加到60名。本學年還有五個月才會結束,但50%到75%的學生已經找到了比較理想的工作。

為什麼該領域會變得如此火爆?琳達-博奇(linda burtch)是芝加哥的獵頭公司博奇工程的董事總經理,她表示,盡管像谷歌(微網誌)、亞馬遜、netflix和uber這樣的高科技公司都有自己的資料科學團隊,但那些非高科技公司,比如neiman marcus、沃爾瑪、clorox和gap,它們現在也需要使用這方面的人才,“很多公司都在物色資料科學家,”她說。

這些公司希望,資料科學專業人才可以挖掘新的資訊,來幫助公司開源節流。ibm負責大資料業務的副總裁anjul bhambhri表示,航空航天制造商pratt & whitney現在可以預測出飛機發動機何時需要進行維護,準确率達到97%,這可以幫助它更加有效地開展業務。

雖然ibm在本月剛剛推出了基于雲計算的watson analytics免費增值工具,但是,為了分析非結構化資料,資料科學家常常不得不親自動手編寫專門的軟體程式,這正是資料科學家必須掌握程式設計技巧的一個原因。

學校教育

洛倫斯說,資料科學家需要具備三項基本技能:數學/統計、計算機能力、在特定業務領域的知識。紐約大學資料科學中心希望招收至少具備其中一種技能的學生,然後培養他們掌握其他技能,讓學生到畢業的時候,可以獨當一面負責處理資料工作。 “在學習過程中,他們要做一些資料科學項目,這些項目需要他們用到這三種技能,”他說。

但是,如果你想成為一名資料科學,也不一定非得去大學讀書才行。從今年9月開始,一家名為梅蒂斯(metis)的公司開始在紐約舉辦為期十二周的資料科學訓練營,費用為1.4萬美元。報名的人非常之多,入學競争相當激烈。梅蒂斯公司的聯合創始人傑森-莫斯(jason moss)說,大約有一半的學生都擁有碩士或博士學位。

第一期訓練營在12月初結束。莫斯說,不過幾周, 15名學生中就有6名拿到了聘用通知。

“我不認為訓練營可以替代大學教育,”莫斯說。“訓練營可以提供一條捷徑,讓你以最快的速度找到一份工作,但大學的目的不在于此。但我也不認為你必須上大學才能成為一名資料科學家,”他說。“有一種人,他們天生具有好奇心,有勇氣,有決心,總想把事情理出頭緒,他們在這一行可以幹得很好。”

anmol rajpurohit是一名獨立的資料科學家兼顧問,他說,做這一行工作最重要的素質就是能夠快速學習東西。“與專長于任何特定程式設計語言相比,泛型程式設計技巧遠遠更加重要,”他說。 “在如今這個時代,技術的發展突飛猛進,語言會很快過時,新的語言則将迅速普及。是以,學東西很快的人,會比單獨領域的專家更有前途。”

洛倫斯說,他認為,在某些技能方面,訓練營和網上課程可以為學習者提供很大的幫助。但在另外一些方面,它們的作用就就相對有限了。紐約大學的資料科學課程有一個優勢,就是可以按照正确的先後順序來培養你的技能。“我們的教學順序可以讓你循序漸進、融會貫通地掌握技能。”他說。

資料科學家要做哪些事?

遊戲公司playstudios的資料科學家喬恩-格林伯格(jon greenberg)說:“在日常工作中,我需要管理一系列控制台,它們提供的資訊可以讓公司知道,我們的生意到底做得怎麼樣? 使用者在做什麼事情?”格林伯格現在是一名經理了,是以他程式設計的時候沒有以往那麼多,但是他有時候仍然需要程式設計。通常來說,他把資料從apache hadoop的存儲器裡調取出來,在分析平台revolution r上運作它,并對它進行一些可視化處理。 “比如說,我們可以從中得知一部分使用者如何與新推出的功能互動,”他解釋說。

六年前,格林伯格拿到了統計學的碩士學位。他希望進入政府部門工作,但卻驚訝地發現,公司企業非常需要資料科學家。 “那個時候,資料科學領域還沒有現在這麼火爆,”他說。現在,他每天都能從獵頭那裡收到一個電話或一封郵件。 “這種情況不隻是發生在我身上,”他說。“所有的資料科學家可能都是這樣。”

對于格林伯格來說,就業機會很好隻是一個加分項,因為他本來就熱愛這一行。 “我認為,要做資料科學工作,你必須得有分析頭腦才行,而且還得有好奇心,”他說。“你必須得有靈活性和創造性,構思出不同的方法來解決問題。”這項工作的唯一缺點,格林伯格說,就是“清潔”資料(去掉那些沒有相關性的結果)需要花費大量時間。“這部分任務并不是那麼招人喜歡,你得花很多時間來做它。”他說。

rajpurohit說,他花了很多精力來清潔資料和做研究。 “我很大一部分時間都花在做研究上,因為我經常會遇到全新的問題,是以,我需要研究特定領域最新文獻,或者是找找專家,聽聽他們在這方面的看法,”他說。

“盡管資料科學這個名字和藝術毫不沾邊,但是你需要把藝術和科學很好地結合起來。科學的部分很明顯——數學,程式設計等等。但藝術部分是同樣重要——創造力,對語境有着深刻的了解。把這兩部分結合在一起,你就會變得善于解決問題。”

盡管如此,rajpurohit也承認,資料科學并不像眼下很多人以為的那樣善良迷人。這個領域确實是在變得越來越重要,而且也出現了很多高薪機會,但在資料科學家需要做的日常工作中,有很多其實都很枯燥。

你是當資料科學家的料嗎?

每天花大量時間來程式設計,分析控制台上的資料,獲得相關資訊,如果你對這樣的工作感興趣,那麼你可能就适合幹這一行。但如果你僅僅是想拿高工資,那麼你可能就會覺得這樣的日子過起來苦不堪言。你要知道:真正适合幹這一行的人,常常會在業餘時間裡編寫程式,分析資料,而他們這樣做隻是為了自娛自樂。

亞當-弗洛葛爾(adam flugel)是博奇公司的資料科學招聘獵頭,他談到了最近遇到的一名候選人。此人擁有博士學位,今年秋天将去電藝公司(electronic arts)工作。“真正讓他脫穎而出的是優勢是,他在空閑時間也做這種事情,而且純粹就是為了好玩,”弗洛葛爾說。“他是多人線上遊戲世界《坦克世界大戰》的玩家,上司着一個玩家團隊。于是他編寫了一個從遊戲伺服器抓取資料的程式,然後進行資料分析,評估自己團隊的表現。然後他利用這些資訊來弄清應該如何調整自己的戰略,應該招收哪些類型的成員,才能提升團隊的整體表現。”

是以,如果你愛的并不是資料本身,而是它可以給你帶來的高薪,那麼你會發現,自己很難與那樣的人競争。但是博奇說,每個人都應該學會熱愛資料,即便隻是為了自己事業前途着想,也該這樣做。 “十年之内,如果你不是資料大咖,你就别想升到‘首席xx官’的位置上”博奇說。

但是像史蒂夫-喬布斯、比爾-蓋茨那樣的情況又怎麼解釋呢?他們擁有遠見卓識,并沒有陷入資料科學的細枝末節之中。“那是30年前的事了,”博奇說。 “我說的是未來10年。”

原文釋出時間為:2015-01-04

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀