本節書摘來華章計算機《資料分析實戰:基于excel和spss系列工具的實踐》一書中的第1章 ,第1.2節,紀賀元 著 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
資料分析是有成本的,這種成本包括時間精力、金錢,以及情感上的煩惱等。既然有成本付出,那人們自然關心,我能夠從資料分析中得到什麼?
曾有人在教育訓練時提出,我公司的業務狀況,我非常清楚,還用得着分析嗎?可是,事實真的是這樣嗎?你真的對公司的資料了如指掌?對它所展現的特征一清二楚?如果公司的資料量比較大、比較複雜,那麼它就有可能存在潛在的價值,就有分析的必要。
資料的整體狀況包括如下内容:
(1)總體狀況
總體銷量是多少?品質問題的總計是多少?研發團隊目前有多少人?研發費用是多少?
(2)結構狀況
在關注總量之餘,我們也關心結構情況,例如銷售在各産品、各區域的分布是怎麼樣的?哪些裝置、哪些機床有品質問題?
(3)異常情況
曾經有客戶問過我這個問題:“老師,我們希望把産品銷售增速放緩的品線找出來,可以嗎?”這裡先解釋一下客戶的需求,就是假如客戶一月份的銷售增速是3%,二月份的增速是3.4%,三月份的增速是4.5%,如果四月份的增速是3.9%,那麼4月份的增速就放緩了,就屬于異常值。
什麼是異常值?簡單地講,就是根據客戶的想法感覺有些異樣的值,這些值是我們要重點關注的東西,并且會試圖分析其背後的原因。後面會成體系地詳細講解。
(4)其他一些資料特征
我們有時候也會關心資料的穩定性、對稱性等特征,後續都會詳細講解。
資料分析的第二個好處是我們可以快速地查詢資料,在資料分析領域中,篩選查詢是一個寬泛的課題,涉及很多技術,從簡單的篩選資料到動态篩選再到access的資料查詢,内容非常豐富。
我曾經碰到一個企業的老總,他跟我說,企業裡面的資料,他不可能都記得很清楚,但是他時常需要了解某個資料,例如某個産品在某個時間段裡的返修率是怎麼樣的,這個時候他會去問秘書,秘書找到資料後再告訴他。“有的時候查一個資料,要一個小時”,這位老總覺得效率不高。
碰到這種情況,如果企業的規模比較大,則需要建立資料庫;對于小規模的企業來說,用vb控件把企業的重要資料全部整合起來放在一個excel檔案中,是一個高效而且切合實際的做法。後面會詳細講解vb控件的具體安裝和應用。
這部分内容應該是資料分析中最像“資料分析”的部分,例如以下的問題:
産品價格中的成本占比是多少?
如果成本上升了,價格怎樣調整才是最優的?
影響産品品質的因素有很多個,假如這些資料都是能量化的,那麼哪些因素對産品品質是有影響的?
肥胖和飲食習慣對冠心病有影響嗎?
這些都是“正規”的資料分析的内容,需要運用一些統計分析的模型算法等進行分析。
1.2.4 業務預測
這裡把業務預測放在資料分析收益的最後,并不代表資料預測的重要性是排在最後的。在我和企業接觸的過程中,發現很多企業都有資料預測的需求,即使我告知他們預測未必很準确,但是一些企業也堅持要做一些預測,他們認為科學預測過的資料,對他們的生産經營等能有一個比較科學的指導。