天天看點

多元度資料分析

在零售業中,資料分析大多采用彙總、對比、趨勢預測、交叉等幾類方法,尤其是交叉分析使用率頗高。交叉分析,顧名思義,是指對資料在不同次元進行交叉展現,進行多角度結合分析的方法,彌補了獨立次元進行分析沒法發現的一些問題。可以說,資料分析的次元彌補了衆多分析方法的獨立性,讓各種方法通過不同屬性的比較,細分,使分析結果更有意義。

橫看成嶺側成峰。我們在看待事物的時候,如果從不同角度看,往往會得出不同的結果。在對業務資料進行分析時,也會有這種現象。如現在對某個區域的銷售資料進行分析。如果以年銷售額來分析的話,也許可以發現每年的銷售收入都在成比例增長。這是一個不錯的結果。但是如果從客戶的角度出發進行分析,管理者可能會發現一些老客戶的銷售額在逐漸降低。

什麼是資料分析的次元?

我們如何了解多元資料中的維?維是人們觀察事物的角度,同樣的資料從不同的維進行觀察可能會得到不同的結果,同時也使人們更加全面和清楚地認識事物的本質。

當資料有了維的概念之後,便可對資料進行多元分析操作,常見的多元分析操作主要有:鑽取(上鑽和下鑽)、切片、切塊、旋轉。鑽取:鑽取是改變次元的層次,變換分析的粒度。鑽取包括上鑽和下鑽,上鑽是在某一維上将低層次的細節資料概括到高層次的彙總資料的過程,減少了分析的維數;下鑽則是相反,它是将高層次的彙總資料進行細化,深入到低層次細節資料的過程,增加了分析的維數。切片和切塊:在多元分析中,如果在某一次元上限定了一個值,則稱為對原有分析的一個切片,如果對多個次元進行限定,每個次元限定為一組取值範圍,則稱為對原有分析的一個切塊。在多元分析中,次元都是按某一順序進行顯示,如果變換次元的順序和方向,或交換兩個次元的位置,則稱為旋轉。

多元度資料分析的典型描述

比如一個典型的商品銷售資料庫,記錄了商品銷售的詳細情況,則我們可從這麼幾個方面來對銷售資料進行分析:從産品的角度,可以按産品的類别、品牌、型号來檢視産品的銷售情況;從客戶的角度,可以按客戶的類别、地區等來檢視産品的購買情況;從銷售代表的角度,可以按銷售代表的部門、級别等來檢視産品銷售業績;從時間的角度,可以按年度、季度、月份等來觀察産品銷售的變動情況。其中産品、客戶、銷售代表、時間分别是四個不同的次元,每個次元都從不同方面展現了銷售資料的特征,而每個次元又可按粒度的不同劃分成多個層次,稱為次元成員,多元分析中另一個重要的概念是資料名額,簡稱名額,名額代表了資料中的可度量的屬性,在上面的銷售資料中有兩個重要的名額是銷售數量和銷售金額。

多元度資料分析的典型案例

看起來還不錯,顯示的資訊非常豐富,左邊包含了以天為機關時間維和産品維,可以使用展開按鈕進行彙總和展開,就像是細分的操作;上面的表頭部分分兩層羅列了地域維和名額維,excel的透視表提供了豐富的設定,預設展現基于各個次元的彙總資料,讓我們可以從“總-分”的角度觀察資料,這對資料分析非常有用。假如我們使用上面的透視表進行交叉分析發現資料是否存在異常?

使用從總體到細節的分析方法,首先可以從檢視每天銷售額和轉化率的彙總資料開始,折疊産品維之後觀察最右側的名額彙總列就可以看到每日彙總資料;如果某一天的銷售額或轉化率出現了大幅的下滑,我們就可以結合各種次元尋找問題的原因,就是基于各種次元的細節資料,展開産品維觀察當天的哪類産品銷售出現了問題,然後結合地域維的交叉資料,可以定位哪類商品在哪個省份的銷售出現了問題,這樣就有效地将問題定位到了細節的層面,能夠更好地發現問題,進而解決問題。是以交叉分析其實正是展現了分析“分而析之”的本意。