本節書摘來自華章出版社《資料分析實戰
基于excel和spss系列工具的實踐》一書中的第1章,第1.4節,紀賀元 著,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
資料分析一般有資料采集、資料整理、制表、資料分析、資料呈現等多個階段。當然,不是說每一個資料分析的過程都需要這些階段,有的企業資料品質非常好,自然就不需要資料采集過程了;也有些資料分析并不怎麼需要呈現過程。不過,為了友善讀者了解,下面将介紹一個完整的流程。
資料采集指為了保證資料分析能夠順利展開而進行的資料采集工作。資料采集工作的難度、跨度非常大,有的采集工作非常簡單,僅僅是幾個簡單的郵件、電話,就能夠完成資料的采集工作;有的資料采集工作則非常痛苦,甚至經常會出現采集不到資料的情況。
資料采集的難度一般表現在如下幾個方面。
(1)資料根本就不存在
由于企業缺乏資料規劃或者現場人員疏漏等原因,在采集資料的過程中,經常發現資料根本就不存在。
(2)資料過粗
如1.1.3節所述,企業經常在資料記錄的顆粒度方面出問題,例如根據某企業的規定,項目的成本資料應該按照“天”為機關來記錄,但是我們最後發現成本記錄的機關是“月”,這中間的差别非常大。
(3)資料品質低下
資料的錯誤、對不上、缺漏等情況普遍存在,曾經有一個項目合作方對我說,如果嚴格校對資料品質,我們的資料可以删除70%。試想想,在30%的比較“靠譜”的資料上做分析,得出的結論是否靠譜?
(4)人為原因導緻資料采集困難
一些人為原因也會導緻資料采集的困難,包括部門之間的隔閡、人際關系等因素。
但凡是做過資料分析的人都知道,資料整理是一個痛苦而且複雜的過程,很多資料拿到手之後,并不能馬上做處理,而是要經過一個轉換過程,請看圖1-4所示的一個需要整理的資料案例。

從圖1-4可以看出,a列的資料都是合并單元格格式,如果要對以上的資料進行透視表分析,需要進行如下的操作。
(1) 取消合并單元格
選中a列,點選excel中的“開始”→“合并後居中”,取消合并單元格之後的資料效果如圖1-5所示。
(2) 填充空白單元格
按f5鍵,點選“定位條件”,如圖1-6所示。
在彈出的界面中選擇“空值”,如圖1-7所示。
這時工作表中的空白都被選中了,效果如圖1-8所示。
在公式欄中輸入“=a2”,也就是讓每一個單元格都等于上一個單元格的值,然後按“ctrl+enter”組合鍵,空白處都填充好了。填充後的效果如圖1-9所示。
以上隻是一個小小的例子,我們在進行資料處理的時候,都要先進行各種資料整理。甚至有時資料整理的時間會占據資料分析時長的70%以上。
制表是日常工作的重要組成部分,也是資料分析的重要組成部分。實際上不少企業已經把企業管理工作貫穿到報表的實作當中,通過一張張精心設計的報表,管理人員可以迅速了解企業的采購、生産、銷售、售後、财務、人事、安全等相關資訊。
企業常見的報表包括如下類型。
采購報表:反映企業各部門的需求,供應商供貨品類、價格等狀況,采購項目進展狀況等;
生産報表:包括産量表、成本表、人力消耗表、裝置故障表、安全品質表等;
财務報表:包括銷售輸入管理、成本管控表、量本利分析表、流動資産管理表、負債管理表、投資項目決策表、财務預測表等;
售後報表:包括樣品跟蹤表、裝置狀況跟蹤、客戶滿意度跟蹤、投訴建議表等;
人事報表:包括人員狀況、薪資福利、人員雇傭離職表等多個報表。
資料分析的範圍非常廣泛,凡是基于業務需求出發且依托于資料進行分析的,就是資料分析。
企業的資料分析一般包括以下方面。
營銷資料分析:這是企業資料分析的主要部分,個人認為也是資料分析最迷人最有魅力的地方。營銷資料分析包括營銷整體狀況分析、客戶分析、産品線分析、促銷分析、客戶畫像、客戶購買原因分析、營銷預測、營銷異常值分析等。
生産品質資料分析:包括生産态勢分析、裝置故障分析、生産成本分析、品質穩定性分析等。
财務資料分析:财務資料分析也是資料分析的主要部分之一,在很多企業,營銷資料和财務資料有很多交集,甚至我見過一些企業的營銷資料基本上是在财務部進行彙總的。财務資料分析一般比較關心異常值分析、财務預測、成本結構、項目投融資決策等多個方面。企業的其他部門也有一些資料分析的需求,不過分布得比較零散。
資料展示這件事情的跨度很大,高度重視資料展示的大企業會購買類似tableau這樣的專業可視化軟體,這類軟體功能強大,能夠承受大資料量的考驗,且運轉速度快;而一般的企業由于實力限制或者沒有那麼高層次的需求,通常利用excel或者一些資料分析插件來優化圖形展示效果即可。