在你的印象中資料科學是21世紀最性感的工作,他不僅能夠帶來滿意的薪酬,而且領域内大量高技能的“極客” 會幫你享受到思想碰撞的樂趣。
但英國《金融時報》的一篇文章中提到:“資料科學家每周花1-2個小時尋找新工作。”此外,文章還指出“在要找新工作的程式員的清單中,機器學習專家們以14.3%的比例名列第一。資料科學家們緊随其後,為13.2%。”這些資料是從對Stack Overflow 上的64000名程式員的問卷調查中來的。
那麼,為什麼有這麼多的資料科學家在尋找新的工作呢?
在享受這份職業帶來的激情與滿足之餘,總有一些消極的方面在給你潑冷水。下面文摘菌就為你帶來四盆冷水,希望不要把你心中的熱火撲滅~
期望和現實不符

期望與現實的對比
大資料就像青少年的性愛:每個人都在談論它,沒有人真正知道如何去做,每個人都認為其他人正在做,是以每個人都聲稱自己在做。
——丹•艾瑞裡
這句至理名言十分恰當的描述了初級資料科學家進入資料科學領域的初衷——每個人都不想讓自己脫離群體。另外想用酷炫到爆的機器學習算法解決複雜問題,進而對企業産生巨大的影響,也是入坑資料科學的另一重要原因。
你或許認為你能從高超的技能中充分感覺到自我價值的實作。然而,事實往往并非如此。
期望與現實不符是許多資料科學家離開的根本原因。其中原委無法一一列舉。
每個公司的情況都不盡相同。但許多公司雇傭資料科學家的時候都沒有做好準備從人工智能中擷取價值的準備,這就導緻了人工智能的冷啟動問題。
加之如果這些公司沒有進階的或者資深的資料從業人員“撐場面”,那就不可避免的會出現讓雙方都處在失望和不愉快的境地。資料科學家們想要編寫機器學習算法來創造有價值資訊,但卻做不到。
因為他們的第一項工作是整理資料基礎結構或建立分析報告。然後公司會因無法看到可觀的價值而感到失望。而這一切都會導緻資料科學家們對他們現狀的不滿。
Robert Chang曾給初級資料科學家提供了一個非常有見地的建議:
你的雄心與你的團隊所選擇的方向是否一緻是非常重要的。如果不一緻,那麼你就需要找到那些最适合你的項目、團隊和公司。
這句話強調了雇主和資料科學家之間的雙向關系。如果公司與資料科學家的目标不一緻,那麼資料科學家另擇新主就隻是時間問題。
資料科學家們感到失望的另一個原因是他們曾經相信我能夠對世界各地的人們産生巨大的影響,而不是僅僅在公司内部。實際上,如果公司的核心業務不是機器學習,你所做的資料科學很可能隻會帶來小幅的增量收益。
政治統治最高
資料科學最困難,而且是不得不面對問題是:政治。
當我早上6點起床去學習支援向量機(Support Vector Machines)的時候,我想:“這真的很難!但是,嘿,至少我會變得對我未來的老闆很有價值!”如果我能得到DeLorean時間機器,我就會回到過去,并對自己說“胡說八道!”
如果你真的認為了解大量的機器學習算法會使你成為最有價值的資料科學家,那麼回到我的第一個觀點:期望與現實不符。
事實是,在商業中最具影響力的人需要對你有不錯的印象。這可能意味着你必須經常做一些從資料庫中擷取資料的簡單項目,來使正确的人對你有正确的認知。
是的,這些工作令人很沮喪。但是,必不可少。
你想上天
希望能夠成為取悅所有人的資料科學家,意味着将成為分析專家,去做報告的人,同時還是資料庫專家。但是這往往偏離了資料科學家的含義。
不僅僅是非技術高管對你的技能有太多的假設,技術部門的其他同僚也會假定你知道所有與資料相關的東西。你熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B測試、NLP,以及任何與機器學習和資料相關内容。
順便說一句,如果你看到一個崗位對上面這些都有要求,請保持遠離。因為這說明這家公司不知道自己的資料政策是什麼,他們會随便招人,因為貌似任何懂資料的人都可以解決他們所有的問題。
但它不止于此。既然你懂得這些技術,而且顯然又可以拿到所有的資料,别人就會期望你在極短的時間内回答所有的問題。
嘗試在可控範圍内交底你的短闆,你并不會真的得到輕視。而作為一個沒有什麼行業經驗的初級資料科學家,你擔心人們會輕視你。
在一個孤立的團隊中工作
我們看到的成功的資料産品,往往具有設計巧妙且具有智能功能的使用者界面。最重要的是,它至少會有一種有用的輸出使得使用者可以通過它來解決一個相關的問題。
現在的問題是,如果一個資料科學家隻學習如何編寫和執行機器學習算法,那麼他們就隻能是一個成功的項目,一個有價值的産品的團隊的一小部分(盡管是必要的)。這意味着孤立工作的資料科學團隊将難以提供價值!
盡管如此,許多公司仍然有資料科學團隊提出自己的項目并編寫代碼來嘗試解決問題。在某些情況下,這可能是有價值的。例如,如果公司需要的隻是每季度一張靜态的電子表格,那麼它确實可以提供一些價值。
可另一方面,如果目标是為網站建構的優化提供明智的建議,那麼這将涉及到許多不同的技能,而這對于絕大多數的資料科學家來說是不可能的(隻有真正的資料科學獨角獸才能解決這個問題)。
是以,如果項目由一個孤立的資料科學團隊承擔,它很可能會失敗。
是以,要想成為一名資料科學的業界翹楚,僅僅在Kaggle競賽中做得很好并完成一些線上課程是不夠的。尋找一個與你的目标大方向一緻的公司,應該是你在尋找能滿足你需求的資料科學工作時的一個關鍵名額。但是,你可能仍然需要調整自己對從事資料科學的期望。
我希望我沒有把你從這條路上拉下來。
原文釋出時間為:2018-04-13
本文作者:文摘菌
本文來自雲栖社群合作夥伴“
大資料文摘”,了解相關資訊可以關注“
”。