天天看點

如何快速成為資料分析師(個人角度)

說來我正式接觸資料分析也快一年,對速成還是有一些心得。優秀的資料分析師是不能速成的,但是零經驗也有零經驗的捷徑。

分享之前我還是要推薦下我自己建立的大資料學習資料分享群 710219868 代号風火,這是全國最大的大資料學習交流的地方,2000人聚集,不管你是小白還是大牛,小編我都挺歡迎,今天的已經資訊上傳到群檔案,不定期分享幹貨,包括我自己整理的一份最新的适合2018年學習的大資料教程,歡迎初學和進階中的小夥伴。

以上的前提針對入門,目的是達到資料分析師的門檻,順利拿到一份offer,不涉及資料挖掘等進階技巧。我的方法傾向網際網路領域,不論是分析師這個職位,還是營運、産品的能力發展都是适用的。其他領域就仁者見仁了。

市面上有《七周七資料庫》,《七周七程式設計語言》。今天我們就《七周七學習成為資料分析師》。

沒錯,七周。

第一周:Excel學習掌握

如果Excel玩的順溜,你可以略過這一周。不過介于我入行時也不會vlookup,是以有必要講下。

重點是了解各種函數,包括但不限于sum,count,sumif,countif,find,if,left/right,時間轉換等。

Excel函數不需要學全,重要的是學會搜尋。即如何将遇到的問題在搜尋引擎上描述清楚。

我認為掌握vlookup和資料透視表足夠,是最具成本效益的兩個技巧。學會vlookup,SQL中的join,Python中的merge很容易了解。學會資料透視表,SQL中的group,Python中的pivot_table也是同理。

這兩個搞定,基本10萬條以内的資料統計沒啥難度,80%的辦公室白領都能秒殺。

Excel是熟能生巧,多找練習題。還有需要養成好習慣,不要合并單元格,不要過于花哨。表格按照原始資料(sheet1)、加工資料(sheet2),圖表(sheet3)的類型管理。

專欄上寫了三篇Excel的文章,比較簡單,大體介紹了Excel應用,可以作為職場新人的指南。

第一篇資料分析—函數篇。主要簡單講解常用的函數,以及與之對應的SQL/Python函數。

第二篇資料分析—技巧篇。主要簡單講解我認為很有新價比的功能,提高工作效率。

第三篇資料分析—實戰篇。主要将前兩篇的内容以實戰方式進行,簡單地進行了一次資料分析。資料源采用了真實的爬蟲資料,是5000行資料分析師崗位資料。

下面是為了以後更好的基礎而附加的學習任務。

了解單元格格式,後期的資料類型包括各類timestamp,date,string,int,bigint,char,factor,float等。

了解數組,以及怎麼用(excel的數組挺難用),Python和R也會涉及到 list。

了解函數和參數,當進階為程式設計型的資料分析師時,會讓你更快的掌握。

了解中文編碼,UTF8和ASCII,包括CSV的delimiter等,以後你會回來感謝我的。

養成一個好習慣,不要合并單元格,不要過于花哨。表格按照原始資料、加工資料,圖表的類型管理

第二周:資料可視化

資料分析界有一句經典名言,字不如表,表不如圖。資料可視化是資料分析的主要方向之一。除掉資料挖掘這類進階分析,不少資料分析就是監控資料觀察資料。

資料分析的最終都是要兜售自己的觀點和結論的。兜售的最好方式就是做出觀點清晰資料詳實的PPT給老闆看。如果沒人認同分析結果,那麼分析也不會被改進和優化,不落地的資料分析價值又在哪裡?

首先要了解常用的圖表:

各類圖表的詳細介紹可以檢視第四篇文章:資料可視化:你想知道的經典圖表全在這

了解圖表後,還應該學會報表制作,這裡準備了第五篇:資料可視化:打造高端的資料報表。将教會大家Excel的進階圖表用法。

如果還不過瘾,我們得掌握資訊圖和BI

BI(商業智能)和圖表的差別在于BI擅長互動和報表,更擅長解釋已經發生和正在發生的資料。将要發生的資料是資料挖掘的方向。

BI的好處在于很大程度解放資料分析師的工作,推動全部門的資料意識,另外降低其他部門的資料需求(萬惡的導資料)。

BI市面上的産品很多,基本都是建立儀表盤Dashboard,通過次元的關聯和鑽取,獲得可視化的分析。第六篇:資料可視化:深入淺出BI 将以第一周的實戰資料學習BI,上圖的就是學習後的成果。

資料可視化的學習就是三個過程,了解資料(圖表),整合資料(BI),展示資料(資訊化)。

可視化也和審美息息相關,很多直男代表并不擅長做圖,沒關系,抽空可以看書:資料之美 (豆瓣)

PPT也别落下,Excel作圖多練習,不會有壞處的