天天看點

不能成為資料科學家?沒關系,你還可以擁有資料思維◆ ◆ ◆◆ ◆ ◆

不能成為資料科學家?沒關系,你還可以擁有資料思維◆ ◆ ◆◆ ◆ ◆

資料科學家日益突顯的影響力令人驚歎——每次讀到這種論調的文章我都感到好笑。雖然不是所有文章都像《哈佛商業評論》一樣宣稱資料科學家将是“21世紀最熱門的職業”,但是,幾乎都是千篇一律的“我們預見了未來”的語氣。我認為這種觀點并沒有錯,但是在這種趨勢中,我沒有發現什麼是值得驚奇或者是新鮮的。如果《洋蔥報》(the onion, 美國最受歡迎的幽默諷刺雜志)要報道,我想标題應該是:

“最新研究表明,精通數學和程式設計的人被大量地雇傭”。

這有什麼新鮮的呢?自從上世紀70年代以來,擅長數學和程式設計的人們就在華爾街發家緻富了。随着越來越多的公司産生海量的資料,對于數學和程式設計技能的需求已經延伸到了新興的行業,更不必說技術部門了。但是,數學和程式設計隻是價值正在迅速上升的量化分析能力中的一部分。去年8月紐約時報的一篇文章是一個極好的例子,能夠說明新聞媒體對此的熱切關注度:一位在舊金山工作的服務生paul minton,在決心成為一名資料科學家後,經過3個月的程式設計和資料分析課程,年薪就從2萬變成了六位數。看呐,一個資料科學的奇迹!

補充一點細節(這篇文章指出了此點非常值得贊揚,雖然隻是略帶而過):minton擁有數學專業的大學學位。換句話說,他是一位非常聰明的服務生。我不了解minton,也不想妄加評論他本人或者紐約時報或者服務生。但是,大多數人是沒有天資在如此短的時間内實作同樣的轉變的。我在以前的部落格和書中曾經說過,我是程式設計學校和非傳統學習平台的忠實擁護者。但是不能隻注意到minton“僅僅3個月”就完成了他的非凡轉變,卻忽略了他之前數年的教育中包含了微積分,統計學,機率論和其他這些除了程式設計技術以外的高深課程,這些都是取得數學大學學位所必須的。我猜minton至少對matlab有一點印象。對于大多數人而言,他們不僅沒有數年的相關訓練,而且即使接受免費教育訓練他們也不一定能夠掌握程式設計能力。我就是其中之一。

相比于我大學時期,現在的就業市場需要數學和統計學能力已經不再是秘密,但是這并不意味着它們更容易學習。在我大學的朋友中,我的量化分析能力至多是略高于平均水準。雖然我的微積分和統計學學得非常好,但是良好的數學基礎使我能夠應付我的經濟學專業的同時,也讓我發現擅長數學不再是我的長期優勢。我清楚地認識到,我的職業生涯無法僅僅建立在我比其他人數學更好的基礎上。對于數學,我想大多數人有這樣的意識後都會比周圍人更加困擾。

我之是以提出這些是希望當你為自己的數學學位感到害羞,聽到資料科學家的需求量巨大就如聽到國家橄榄球聯盟的四分衛收入很高一樣時,能夠清醒地說,“是的,當然如此。”

好消息是,即使不能成為一位資料科學家,通過培養自己的資料思維,你仍然能夠提升自身價值,使工作更出色。

當今職場秘密武器:用資料說話

這些年有一件讓事情讓我震驚:大多數人對自己公司的資料的了解少之又少。我接觸過的大多數公司裡根本沒有幾個人有能力用最基本的方法分析他們的資料,更别提有足夠的資料科學家人手了。最近有個大型酒店集團的營銷經理向我吐槽:公司裡“也就2-3個人”可以分析原始的銷售資料,隻有他們對業務和内部資訊系統都有足夠的了解。我接觸的另一個商用品分銷公司有幾萬名員工,但是隻有5、6個人可以快速地回答公司高層提出的問題,其他的人要麼不夠了解資料庫要麼不夠了解公司業務。還有一個大型零售連鎖集團裡隻有很小一撮人可以很快地分析他們的原始資料。很多公司甚至專門設立了”客戶洞察”部門。他們的使命是專門幫助其他部門解決跟那些該死的資料有關的問題。

是什麼造成了這種現象呢?

這些公司的資訊系統應該負一部分責任。現在有很多企業因為時間的積累或者是多次并購,繼承了很多個不同類型的資訊系統。這些系統對于沒有技術背景的人來說非常難以使用。僅僅這一條就可以讓大多數的人對于公司的原始資料望而卻步。但是更大的障礙其實是人的惰性。就算公司有還不錯的分析資料的工具(比如一個關系型資料庫),也隻有少數的人有耐心和好學心去了解。其他大多數人隻是想等待資料出現在一個excel表格裡或者一個展示闆上供他們使用。這不簡單是需要學習一門新的查詢語言(sql)的問題。要想要明白公司的資料模型是怎樣的,資料是怎麼樣存儲的這些都需要反複實驗,這會消耗很多耐心和精力。現實世界中的資料和在商學院中用的資料是完全不一樣的,手裡的資料永遠沒有書裡的那麼整潔可靠。這就是為什麼絕大部分人都直接使用他們的it部門整合好的資料。這些資料比較靠譜,不需要考慮太多跟資料本身無關的事情。

但是僅僅使用這些别人寫好的資料報告和展示闆有一個問題,就是你很難在職場中脫穎而出。因為大家的資訊都是對稱的,這些資料的一絲一毫所有人都看的清清楚楚。雖然資料的品質很重要,但這會大大限制你創新的能力。當你手中别人給你做好的資料并不能幫助你解答你想知道的問題時怎麼辦?舉個例子,假設你想測試一下那些全家自駕遊的客人在酒店的消費特征。這時你需要自己篩選分析那些隻來過酒店一次,點了兒童菜單的東西到房間裡而且還加了一張折疊床的客戶。這種分析可以讓你的老闆認真聽取你報告的内容。這種問題如果可以自己解決比要要别人幫助好十倍。

解決這些問題并不難,不需要高中畢業就可以搞定。你隻需要合适的資料加上一顆好學心。

提出簡單的問題可以事半功倍

有人說聰明的人喜歡問複雜的問題,但是絕頂聰明的人往往會問簡單的問題。的确,最重要的業務問題往往也是最簡單的問題。比如:為什麼客戶沒有選擇競争對手的産品而是選擇了我們的産品?為什麼曾經選擇了我們産品的人卻最終放棄了這個産品?我們應該為了增加銷售量而降價嗎?當你是職場新人的時候你往往在埋頭做一些細節的工作,沒人會問你這種問題。但随着你經驗增多,真正可以搞定這些問題的時候你可以開始為解決公司最根本最重要的問題做貢獻,升職加薪走向人生巅峰!

回顧我的職業生涯,我學到最有用的業務技能就是sql,用這個語言我可以直接查詢一個公司的原始營運資料,直接了解關于這個公司業務的基本特點。我漸漸發現自己很擅長提出不錯的問題,需要的隻是一些能幫我解決這些問題的工具。更重要的是,當一個人用過内部的資料庫查詢過公司的資訊後你就會發現,使用資料庫的經驗可以教你提出更好的問題。說白了就是,用過資料庫之後就知道怎樣可以提出一個在資料庫中可以精确回答的問題。這讓人沒有以前那麼懶惰,因為計算機和人不一樣,它并不懂得怎樣揣摩你真正的意圖。這樣在不知不覺中就學會了如何更加系統地思考。

原文釋出時間為:2016-03-18

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号