OLAP(On-Line Analytical Processing)聯機分析處理,1993 年由關系型資料庫之父埃德加·科德(Edgar Frank Codd)提出,其中主要為多元分析。
多元分析常見操作
-
下鑽
從高層次想低層次明細資料穿透。例如從“國家”到“城市”,從“中國”下鑽到“上海市”和“北京市”
-
上卷
與下鑽相反,從低層次向高層次彙聚
-
切片
觀察多元資料立方體的一層,可以了解為“控制單一次元”觀察資料,例如人口普查隻看上海的統計結果
-
切塊
類似與切片,“控制單一次元在某一區間進行分析”,例如人口普查隻看上海、北京的統計結果
-
選裝
選裝立方體的一面,等于行列置換
常見 OLAP 架構
-
ROLAP (Relational OLAP)
基于關系模型進行建構的 OLAP 分析,早期架構,不支援大體量資料運算
-
MOLAP (Multidimensional OLAP)
利用預計算,提前建構多元資料立方體(Cube),例如 Kylin
-
HOLAP (Hybrid OLAP)
ROLAP、MOLAP 混合架構
OLAP 實作技術
架構 | 技術實作 |
---|---|
OLAP | RDBMS |
MOLAP | Hive、HBase、Spark、Flink |
HOLAP | Hive、HBase、Spark、Flink |