天天看點

分布式資料倉庫設計做大做強事實表,做小做弱維表;

分布式模式-次元模組化新原則

  (1)以值代鍵:針對鍵值唯一的維表,除非必要,否則不引入維表,如IP位址維表,采用IP作為維表的主鍵,事實表中存儲IP值;

      (2)合理分表:傳統關系型資料倉庫存在多表整合的沖動,如上圖Event事實表,各種Acount Ind,Finance Ind等,用來擴充表的通用性,試圖把所有的資料都存儲到一張表 中。分布式資料倉庫的設計,恰恰相反,因為單表資料規模的問題,如果要滿足分析和處理的性能,合理的按照業務進行資料的分表存儲。如财務相關事件、賬戶相關事件,單獨成表。更有利于資料的計算和分析