天天看點

《BI那點兒事》資料倉庫模組化:星型模式、雪片模式

資料倉庫模組化 — 星型模式

Example of Star Schema

《BI那點兒事》資料倉庫模組化:星型模式、雪片模式
《BI那點兒事》資料倉庫模組化:星型模式、雪片模式

資料倉庫模組化 — 雪片模式

Example of Snowflake Schema

節省存儲空間

一定程度上的範式

《BI那點兒事》資料倉庫模組化:星型模式、雪片模式
《BI那點兒事》資料倉庫模組化:星型模式、雪片模式

星形 vs.雪花型

Which one is better?

長期以來的争論

兩種觀點各有支援者

争論在繼續……

目前看來,大部分更加傾向于星型

支援星形次元的論點

事實表總會是很大的,在次元表上節省的空間相對來說是很小的

增加了資料模型的複雜度

查詢操作概念上更複雜了

從資料倉庫到多元資料庫的加載時間會更長

是以,隻有當次元表極大,存儲空間是個問題時,才考慮雪花型次元

簡而言之,最好就用星型次元即可

支援雪花型次元的論點

從資料倉庫到多元資料庫的加載過程中,雪花型次元的效率更高;

雪花型次元描述了更清晰的層次概念;

隻有當最終使用者可能直接通路資料倉庫時才考慮星形(而這是不被建議的);

我的個人經驗

星形結構效率上優于雪花型;

多數情況下,我會選擇星型,但是不排除使用雪花型的情況;