“
0. 序言
”
寫在前頭,資料分析的魅力在于發現一些有趣的結論。這是一個故事:經過深入地分析了銷售資料,做了很多種不同的大膽假設,并小心檢驗了假設的合理性。
發現有一群男性使用者,他們用女性的保濕霜,來做剃須後的保養。這群人對産品的需求很特别,但是,他們并不宣揚自己的這種需求,導緻我們平時很難發現他們。

資料分析的故事從這裡開始.......
假設你的客戶(可能是你的上司,也可能就是你自己),給你發來一份銷售資料,他希望你分析分析,看看如何提高銷量。
你不妨先自己思考一下,當你接到這個分析任務的時候,你會怎麼做?然後再看看下面我是怎麼做的,這也是一種對比思維,促進自己多思考和總結,歡迎在文章下面留言分享你的想法。
“
1. 明确目标
”
上國中的時候,我們學過函數的概念,通常用 y = f(x) 來表示函數,它包含 3 個要素:自變量 x、因變量 y 和對應法則 f。我們可以把函數中的 y 了解為目标,把 x 了解為資料,把 f 了解為實作目标的方法,要找到合适的方法不容易,這需要對業務有深刻的了解。
資料分析的第一步,是明确業務的目标,關鍵在于搞清楚客戶關心的是什麼。如果未明确目标就進行資料分析,那麼就如同旅行沒有目的地,不知道終點在哪裡。
比如說,客戶的目标是提高銷量,但這還不夠明确,為了搞清楚客戶的真正意圖,你得了解更多的資訊,多問幾個「是多少」,使目标得到量化。例如:您希望銷量提高多少?
“
2. 應用思維
”
現實世界複雜多變,我們通常應用思維來了解業務的實際情況。
你的分析觀點往往來自于你的分析思維,是以正确地運用好分析思維是非常重要的。
參考《資料分析的 8 種思維》,首先,我們可以運用對比思維,對資料進行有效的對比,這是資料分析工作的核心方法之一。
其次,我們運用細分思維,對資料進行細分,關鍵是要找出高效的對比因子,先分次元,再分粒度。通過多個次元的細分,将對比的差異按粒度逐級鎖定,對問題進行定位,尋找問題的根源。
然而,問題的答案可能還是沒有找到,此時你可以運用溯源思維,密切關注更多的細節資料,想辦法從原始資料中進行追溯,思考使用者的行為特征,深入挖掘資料背後隐藏的資訊。
在資料分析的過程中,我們可以運用假設等思維,大膽假設,小心求證。無論是建構複雜的分析模型,還是進行簡單的資料決策,都要做出自己的設想和判斷。
最後,要做好心理準備,如果通過分析,發現資料有違你的假設,那麼就更加需要你進行詳細思考,仔細推敲,在這個過程中,你對使用者行為的了解也會逐漸加深,進而資料分析的功力也會得到增強。
“
3. 處理資料
”
假設經過整理後的銷售資料如下表:
我們用 Python 進行讀取并預覽資料。
通過觀察發現,資料中包含每天的實際銷量、目标銷量和目标完成率,為了從更加宏觀的層面,把握銷售的整體情況,我們按月份進行彙總,首先,在表格最前面的位置插入一列:月份。
然後按月份進行彙總求和,重新計算月度彙總的目标完成率,并将彙總結果儲存到 Excel 檔案中。
“
4. 分析推理
”
仔細觀察上面的月度彙總資料,你會發現,與 7 月份進行對比,8 月份的銷量略有上升,但與目标進行對比,目标完成率反而下降,這是一個比較嚴重的問題。
為了搞清楚這個問題産生的原因,你可以先進行探索性的資料分析。
在 Python 中,有一個很實用的包:pandas-profiling,号稱用 1 行代碼就能生成資料分析報告。如果你還沒有安裝的話,推薦你在指令行運作一下:pip install pandas-profiling,然後在 Jupyter Notebook 中運作以下代碼:
這是一份比較詳細的探索性資料分析報告,上圖僅顯示了其中一小部分資訊,往下拉,可以看到每個變量的資料分布等情況。
繼續往下拉,還可以看到各個變量之間的相關性,從圖中能夠直覺地看到:實際銷量與目标完成率之間具有比較強的正相關性,這也很好了解,因為在目标銷量變化不大的情況下,實際銷量越高,目标完成率也就越高。
在做進一步的分析之前,你還需要熟悉業務的背景,假設公司經營的業務是在網上商城賣化妝品,提高 8 月份目标銷量,是因為 8 月份加大了廣告費的投入。但是,廣告的效果并沒有達到預期,是以目标完成率下降了。
對于「如何提高銷量」這樣一個大問題,我們很難直接回答,可以試着細分為小問題,例如:哪種促銷方式效果更好?我們的使用者希望得到什麼?
上面案例中的銷量資料,已經按時間的次元做了劃分,實際上,除了按時間次元進行細分以外,還可以嘗試很多種不同的細分次元。比如說,按地區的次元:省份、城市等等,按銷售管道的次元:京東、天貓等等。
現實情況往往是複雜的,需要你運用相關思維,理清各種關系。比如說,從廣告展示,到使用者點選,再到付款購買,形成一個銷售漏鬥,每個環節都有相應的轉化率名額。
為了尋找提高銷量的機會,你可以嘗試運用假設思維,列出一些假設情況,例如:假設換種促銷方式會怎麼樣?假設降低産品的價格會怎麼樣?
假設你經過深入分析,在原始資料中,發現一些購買保濕霜的男性使用者,而這些保濕霜原本是專門為女性使用者設計的。經過調研,你知道了這些男性購買化妝品的用途,原來他們是用保濕霜來做剃須後的保養,這恐怕是一個有價值的發現。
“
5. 提出建議
”
你懷着激動的心情,開始撰寫資料分析報告。此時你要記住,資料分析報告的重點,不是那些花裡胡哨的圖表,而是提出有效的行動建議。
除非将資料分析用于做出更好的決策,否則,資料分析将毫無用處。
是以,作為一名資料分析師,要想方設法提出有效的行動建議,為業務創造價值。
首先,你要清楚地知道,自己從資料中發現了什麼,要指出不确定因素,小心防範并想辦法填補知識的空白,盡量避免作出過頭的結論,對分析結果負責,積累自己的信用,讓客戶更尊重和信任你,并了解你的分析和判斷也具有局限性。
其次,你提出的行動建議,重點是要得到客戶的了解,鼓勵客戶以資料為基礎,進而作出明智的決策。
最後,在資料分析報告中,你需要簡明扼要地闡述分析成果,并提出建議改善的措施。
例如:我深入地分析了銷售資料,做了很多種不同的大膽假設,并小心檢驗了假設的合理性。我發現有一群男性使用者,他們用女性的保濕霜,來做剃須後的保養。這群人對産品的需求很特别,但是,他們并不宣揚自己的這種需求,導緻我們平時很難發現他們。是以,建議推出男性更容易接受的剃須保養産品,增加對這群人的廣告投放,我認為這将提高銷量。
“
6. 小結
”
本文介紹了分析資料、解決問題的一種思路。
首先,明确業務的具體目标。
其次,應用分析思維來了解業務的實際情況。
再次,用 Python 對資料進行彙總處理。
然後,綜合運用各種分析思維和分析工具,對資料進行分析推理。
最後,得出主要的分析結論,提出有效的行動建議。
限于文章的篇幅,本文并沒有深入探究具體的業務細節,如果你想了解更多分析資料的方法,請在文章下面留言告訴我。
下面是本文的思維導圖: