天天看點

資料分析行業需要具備哪些技術 如何快速進入

資料分析行業需要具備哪些技術 如何快速進入

大資料如此火爆的時代,各種人才倍受青睐。視野決定了境界和能力,而所處的環境又決定了視野。好多人不知道什麼是資料分析師,認為會熟練使用excel就是資料分析師,如果你還會使用excel中的一些進階功能如透視和函數等等,可能别人就認為你是牛*的資料分析師了,如果你工作中還用到了vba,(word天啊!),在别人眼中你就是資料分析大神了。真的是這樣嗎?誠然,單用excel的确可以解決大部分的資料問題,但是作為一個資料分析師,你并不是一個基層的統計分析從業者,那麼資料分析師應該是怎樣的職業呢?

(一)資料分析師的職場之路

資料分析行業需要具備哪些技術 如何快速進入

圖1:資料分析職位分類

資料分析的職位分類按照資料處理的不同階段分為資料采集、資料分析、與資料挖掘三種。其中資料采集的概念是對企業來說的,是jacky企業(航航資料)在做的事,包括原始資料源的采集和地理資訊資料的采集,這裡閱聽人面太窄,就不一一說了,想了解的朋友可以私信我。

下面主要說下資料分析和資料挖掘的職位:

大家要記住一句話:資料分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉升途徑,包括下面章節要說的資料分析的學習規劃也跟這兩個方向緊密相關。

1、業務方向

大家在招聘網站中搜尋資料分析的職位,大概分為兩類:輔助業務的資料分析職位和資料分析師職位。

1)輔助業務的資料分析:一般在零售業裡職位設定較多,該職位一定要對業務爛熟于心,對業務有長時間的積澱和了解,用資料發現業務流程中的問題,并提出合理化的解決方案,分析資料是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。

2)資料分析師:業務方向的資料分析師,該職位招聘時一定前面有一個限定詞,什麼資料分析師,歸結起來分為三類:産品資料分析師,營運資料分析師和銷售資料分析師。

2、技術方向

技術方向主要指資料挖掘方向,分為三類:資料挖掘工程師(機器學習)、資料倉庫工程師(構架師)和資料開發工程師。在網際網路和金融行業崗位設定較多

普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。

(二)資料分析從業者需具備的核心能力

我認為,資料分析從業者要具備四種核心能力:1、基礎科學的能力;2、使用分析工具的能力;3、掌握程式設計語言的能力;4、邏輯思維的能力

資料分析行業需要具備哪些技術 如何快速進入

圖2:資料分析核心能力體系

1、基礎科學的能力

可以說,在資料決策的時代,資料分析幾乎滲透到企業的每個業務環節中,行業資料分析報告更是淋漓滿目,釋出報告的有的是世界500強企業,有的是知名的資料洞察咨詢公司,jacky做為第三方資料評估機構的從業者,在看到可視化效果越來越絢麗的同時,我也憂心忡忡,大多數的資料分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。

統計學,數學,邏輯學是資料分析的基礎,是資料分析師的内功,内功不紮實,學再多都是徒勞。

掌握統計學,我們才能知道每一種資料分析的模型,什麼樣的輸入,什麼樣的輸出,有什麼樣的作用,開始我們并不一定要把每個算法都弄懂。

如果我們要做資料挖掘師,資料能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,子產品也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉升。

2、使用分析工具的能力

資料分析工具:sql、spss、sas、r、excel等等吧,都必須掌握并且會應用,畢竟企業需要的不是學者而是應用型人才。

3、掌握程式設計語言的能力

不會python、不會r,說你懂資料分析誰都不信。

4、邏輯思維的能力

邏輯思維對于資料分析來說特别重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業資料裡,大家可以了解為去搭建商業架構或者說是故事線,有邏輯的推進,結果才會另人信服。

下面補充下做資料分析的流程邏(參考知乎網友,有改進,非原創):

1)提出假設

2)驗證假設(統計方法)

3)取數(sql / hive / spark)

4)清洗和整理資料(r / python pandas / pyspark)

5)可視化(excel / r ggplot2 / python matplotlib)

6)展示給非技術人員(powerpoint / tableau / ipython notebook / r markdown)

(三)2017,資料分析學習規劃

任何一門技術或學科都有其内部規律,需要有計劃,有先後,循序漸進來學,jacky跟大家分享下潤祿資料學院的一些經驗:2017,資料分析的學習規劃(因個體差異,僅供參考)

下圖:橙色區域代表資料采集闆塊,藍色區域代表資料分析闆塊,綠色區域代表資料挖掘闆塊。

資料分析行業需要具備哪些技術 如何快速進入

圖3:資料分析學習規劃(從入門到中級)

1、統計學(業務方向)與sql(技術方向):首要必會技能

任何資料分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助spss或其他sas來學,做到資料分析基本功紮實,兼顧實戰性。

任何資料分析師從事技術方向的工作都必會sql,不單是資料分析師,每一個營運、産品經理、尤其是網際網路行業,一定要會sql,基本知名網際網路公司的産品經理都能寫sql。

學習中,要掌握sql的基礎文法、中級文法和常用函數,結合關系資料庫系統(oracle database、sql server、db2等)來學習sql語句,找好方法,真的不難。

2、python與r:不分伯仲,都要掌握

python主要掌握基礎文法,pandas操作、numpy操作、sklearn模組化,學會用python編寫網絡爬蟲爬取資料,等等。

r語言就是為了統計而存在的語言,我們要掌握r語言的基礎文法、資料管理、資料挖掘模組化與評估等。

以上是我們第二階段要學的技能。

3、資料可視化

有了python、和r的基礎,我們可以就可以學習資料可視化了。營運和産品都需要學習可視化,可視化說白了,就是畫圖,但做為資料分析師來說,我們不能用excel 來實作可視化,因為它的局限性太大了。這裡也不建議花太多時間學習給非專業人士展示的tableau,有1個小時學會tableau足夠。

python中可視化的工具有matplotlib,seaborn,ploltly;

r中可視化工具有plot基礎庫、ggplot2

随心所欲,用python和r,你就知道做資料分析工作是多麼爽一個事

4、資料挖掘

這裡知道要掌握基本概念,知道資料挖掘時做什麼的,知道它與資料分析相比有什麼不同

5、監督學習、非監督學習、模型評估

model模組化,知道模型建好後應該怎樣去評估,掌握怎樣用一些定量的名額,資料,數值來衡量模型建好後到底有多準确,或者說到底有多錯誤。模型評估的名額或計算方式選擇正确與否,能夠直接影響到整個項目獲模型是否有效。

6、以上這些隻是資料分析的入門,還有... ...

機器學習,文本與自然語言處理,分布式計算工具spark.... ...

資料分析的路上,你準備好了嗎?2017,跟我一起,來逆襲吧

本文作者:潤祿資料jacky

來源:51cto