天天看點

資料立方體的基本計算

     資料立方體計算是資料倉庫實作的一項基本任務。這裡介紹幾種計算方法

1.多路數組聚集計算法(multiway)(計算完全方體)

(1)把數組劃分成塊,塊是一個子立方體,它足夠小可以放入立方體計算時所需的記憶體即可。

(2)通過通路立方體單元(即擷取立方體單元的值)來計算聚集。

例:一個空間立方體(我上篇所用的那個),我們要計算它,将它劃分成很小的基于記憶體的塊。我們将其化為64塊(a0b0c0(1),a1b0c0(2)...a3b3c3(64))這樣我們首先計算基本方體(包含abc的所有方體,然後計算2-D方體,1-D方體,0-D(頂點)方體)

2.BUC從頂點方體向下計算冰上立方體(計算稀疏冰山立方體)

1.首先掃面整個輸入,計算整個度量

2.針對方體的每一維進行劃分

3.針對每一個劃分,對他進行聚集,為該劃分建立一個元組并得到該元組的計數。判斷其分組基數是否滿足最小支援度。

4.滿足輸出該劃分的聚集元組并在該劃分下對下一維進行遞歸調用。否則剪枝。

資料立方體的基本計算

3.動态星型結構計算冰山立方體(star-cubing)

它是一種內建自頂向下和自底向上的立方體計算方法

資料立方體的基本計算

如圖以ABD為根的子樹中的所有方體都包含維AB,我們把子樹中所有方體都包含的維成為共享維。

接下來我們建構方體樹,樹的每一層代表一個維,每個節點代表一個屬性值。建構方體樹和共享維是為了友善剪枝

資料立方體的基本計算

如果單個維A的屬性值P上的聚集不滿足最小支援度,則将該節點用×替換,進而進一步壓縮方體樹。我們稱屬性A中的節點P為星界定啊,使用星節點壓縮的方體樹稱為星樹。