天天看點

OLAP、多元分析基本概念

OLAP(On-Line Analytical Processing)聯機分析處理,1993 年由關系型資料庫之父埃德加·科德(Edgar Frank Codd)提出,其中主要為多元分析。

多元分析常見操作

  • 下鑽

    從高層次想低層次明細資料穿透。例如從“國家”到“城市”,從“中國”下鑽到“上海市”和“北京市”

  • 上卷

    與下鑽相反,從低層次向高層次彙聚

  • 切片

    觀察多元資料立方體的一層,可以了解為“控制單一次元”觀察資料,例如人口普查隻看上海的統計結果

  • 切塊

    類似與切片,“控制單一次元在某一區間進行分析”,例如人口普查隻看上海、北京的統計結果

  • 選裝

    選裝立方體的一面,等于行列置換

常見 OLAP 架構

  • ROLAP (Relational OLAP)

    基于關系模型進行建構的 OLAP 分析,早期架構,不支援大體量資料運算

  • MOLAP (Multidimensional OLAP)

    利用預計算,提前建構多元資料立方體(Cube),例如 Kylin

  • HOLAP (Hybrid OLAP)

    ROLAP、MOLAP 混合架構

OLAP 實作技術

架構 技術實作
OLAP RDBMS
MOLAP Hive、HBase、Spark、Flink
HOLAP Hive、HBase、Spark、Flink

繼續閱讀