大資料如此火爆的時代,各種人才倍受青睐。視野決定了境界和能力,而所處的環境又決定了視野。好多人不知道什麼是資料分析師,認為會熟練使用excel就是資料分析師,如果你還會使用excel中的一些進階功能如透視和函數等等,可能别人就認為你是牛*的資料分析師了,如果你工作中還用到了vba,(word天啊!),在别人眼中你就是資料分析大神了。真的是這樣嗎?誠然,單用excel的确可以解決大部分的資料問題,但是作為一個資料分析師,你并不是一個基層的統計分析從業者,那麼資料分析師應該是怎樣的職業呢?
(一)資料分析師的職場之路
圖1:資料分析職位分類
資料分析的職位分類按照資料處理的不同階段分為資料采集、資料分析、與資料挖掘三種。其中資料采集的概念是對企業來說的,是jacky企業(航航資料)在做的事,包括原始資料源的采集和地理資訊資料的采集,這裡閱聽人面太窄,就不一一說了,想了解的朋友可以私信我。
下面主要說下資料分析和資料挖掘的職位:
大家要記住一句話:資料分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉升途徑,包括下面章節要說的資料分析的學習規劃也跟這兩個方向緊密相關。
1、業務方向
大家在招聘網站中搜尋資料分析的職位,大概分為兩類:輔助業務的資料分析職位和資料分析師職位。
1)輔助業務的資料分析:一般在零售業裡職位設定較多,該職位一定要對業務爛熟于心,對業務有長時間的積澱和了解,用資料發現業務流程中的問題,并提出合理化的解決方案,分析資料是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。
2)資料分析師:業務方向的資料分析師,該職位招聘時一定前面有一個限定詞,什麼資料分析師,歸結起來分為三類:産品資料分析師,營運資料分析師和銷售資料分析師。
2、技術方向
技術方向主要指資料挖掘方向,分為三類:資料挖掘工程師(機器學習)、資料倉庫工程師(構架師)和資料開發工程師。在網際網路和金融行業崗位設定較多
普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。
(二)資料分析從業者需具備的核心能力
我認為,資料分析從業者要具備四種核心能力:1、基礎科學的能力;2、使用分析工具的能力;3、掌握程式設計語言的能力;4、邏輯思維的能力
圖2:資料分析核心能力體系
1、基礎科學的能力
可以說,在資料決策的時代,資料分析幾乎滲透到企業的每個業務環節中,行業資料分析報告更是淋漓滿目,釋出報告的有的是世界500強企業,有的是知名的資料洞察咨詢公司,jacky做為第三方資料評估機構的從業者,在看到可視化效果越來越絢麗的同時,我也憂心忡忡,大多數的資料分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。
統計學,數學,邏輯學是資料分析的基礎,是資料分析師的内功,内功不紮實,學再多都是徒勞。
掌握統計學,我們才能知道每一種資料分析的模型,什麼樣的輸入,什麼樣的輸出,有什麼樣的作用,開始我們并不一定要把每個算法都弄懂。
如果我們要做資料挖掘師,資料能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,子產品也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉升。
2、使用分析工具的能力
資料分析工具:sql、spss、sas、r、excel等等吧,都必須掌握并且會應用,畢竟企業需要的不是學者而是應用型人才。
3、掌握程式設計語言的能力
不會python、不會r,說你懂資料分析誰都不信。
4、邏輯思維的能力
邏輯思維對于資料分析來說特别重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業資料裡,大家可以了解為去搭建商業架構或者說是故事線,有邏輯的推進,結果才會另人信服。
下面補充下做資料分析的流程邏(參考知乎網友,有改進,非原創):
1)提出假設
2)驗證假設(統計方法)
3)取數(sql / hive / spark)
4)清洗和整理資料(r / python pandas / pyspark)
5)可視化(excel / r ggplot2 / python matplotlib)
6)展示給非技術人員(powerpoint / tableau / ipython notebook / r markdown)
(三)2017,資料分析學習規劃
任何一門技術或學科都有其内部規律,需要有計劃,有先後,循序漸進來學,jacky跟大家分享下潤祿資料學院的一些經驗:2017,資料分析的學習規劃(因個體差異,僅供參考)
下圖:橙色區域代表資料采集闆塊,藍色區域代表資料分析闆塊,綠色區域代表資料挖掘闆塊。
圖3:資料分析學習規劃(從入門到中級)
1、統計學(業務方向)與sql(技術方向):首要必會技能
任何資料分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助spss或其他sas來學,做到資料分析基本功紮實,兼顧實戰性。
任何資料分析師從事技術方向的工作都必會sql,不單是資料分析師,每一個營運、産品經理、尤其是網際網路行業,一定要會sql,基本知名網際網路公司的産品經理都能寫sql。
學習中,要掌握sql的基礎文法、中級文法和常用函數,結合關系資料庫系統(oracle database、sql server、db2等)來學習sql語句,找好方法,真的不難。
2、python與r:不分伯仲,都要掌握
python主要掌握基礎文法,pandas操作、numpy操作、sklearn模組化,學會用python編寫網絡爬蟲爬取資料,等等。
r語言就是為了統計而存在的語言,我們要掌握r語言的基礎文法、資料管理、資料挖掘模組化與評估等。
以上是我們第二階段要學的技能。
3、資料可視化
有了python、和r的基礎,我們可以就可以學習資料可視化了。營運和産品都需要學習可視化,可視化說白了,就是畫圖,但做為資料分析師來說,我們不能用excel 來實作可視化,因為它的局限性太大了。這裡也不建議花太多時間學習給非專業人士展示的tableau,有1個小時學會tableau足夠。
python中可視化的工具有matplotlib,seaborn,ploltly;
r中可視化工具有plot基礎庫、ggplot2
随心所欲,用python和r,你就知道做資料分析工作是多麼爽一個事
4、資料挖掘
這裡知道要掌握基本概念,知道資料挖掘時做什麼的,知道它與資料分析相比有什麼不同
5、監督學習、非監督學習、模型評估
model模組化,知道模型建好後應該怎樣去評估,掌握怎樣用一些定量的名額,資料,數值來衡量模型建好後到底有多準确,或者說到底有多錯誤。模型評估的名額或計算方式選擇正确與否,能夠直接影響到整個項目獲模型是否有效。
6、以上這些隻是資料分析的入門,還有... ...
機器學習,文本與自然語言處理,分布式計算工具spark.... ...
資料分析的路上,你準備好了嗎?2017,跟我一起,來逆襲吧
本文作者:潤祿資料jacky
來源:51cto