在大資料技術領域裡,使用者通常希望獲得高可靠、低延時的資料服務,來滿足簡單或者複雜的查詢場景。本文整理自2019年雲栖大會大資料技術專場互動式分析團隊的精彩演講,為您深度揭秘互動式分析的核心技術以及應用場景,打開開發大資料的正确姿勢!
本文内容整理自雲栖大會演講視訊以及PPT。
更多詳情請點選:
雲栖大會互動式分析現場分享互動式分析是阿裡雲的一款實時數倉産品,實時數倉最常用的兩種查詢為簡單查詢和複雜查詢,簡單查詢例如典型的雙11媒體大屏,複雜查詢例如AB實時test。針對兩種實時數倉的查詢場景,典型的業務架構為:使用者産生的資料進入消息隊列(例如阿裡雲的DataHub),然後經過實時處理(例如Flink)初步聚合,存儲到存儲服務裡,之後進行資料服務,但由此會産生兩個核心的問題:
1.資料選用什麼存儲服務?
2.如何對外提供高可靠、低延時的資料服務?
針對資料存儲,目前市面上常用的産品可能是:
1.基于行存适用于高并發簡單查詢的Hbase、Cassandra;
2.基于列存适用于複雜大掃描查詢的Druid、Kudu。
而開發人員往往會根據業務特性來選擇适合自己的存儲,當業務足夠複雜的時候,可能一個業務需要多套存儲系統,為開發、運維帶來難度。除此之外,根據業務不同的需求,在資料查詢方面也會有不同的需求,比如有時需要簡單查詢,有時需要複雜關聯查詢,這時又需要使用不同的計算引擎來提供資料服務,這無疑又給開發、運維帶來一定難度。
互動式分析的誕生就是為了解決以上問題,為使用者提供一站式高并發、低延時的存儲和計算一體化的資料服務,并與大資料生态無縫打通,讓你使用現有BI工具就能實作PB級資料的秒級查詢分析。
互動式分析--秒級實時數倉
-
大規模計算型存儲
采用存儲、計算分離的架構,支援簡單查詢與複雜SQL查詢。
-
高性能查詢服務
使用互動式分析實作PB級資料秒級查詢響應。
-
相容PostgreSQL生态
意味着隻要會使用PostgreSQL就能使用互動式分析,大大降低學習成本。同時,也意味着所有對接PostgreSQL的工具也能對接互動式分析,例如PostgreSQL自有的用戶端(psql)、BI分析工具(Tableau、Quick BI)等。
典型應用場景
互動式分析經過在集團内的多年沉澱,已形成自有的典型應用場景,并且廣泛用于網際網路、新零售、IOT、金融等各個業務。

系統架構
- 底層存儲在盤古系統中,存儲計算分離,并與MaxCompute在底層無縫打通,可直接對MaxCompute資料加速查詢。
- 相容PostgreSQL,提供JDBC、ODBC接口可直接對接各種開發工具、BI分析工具。
開發大資料的正确姿勢--互動式分析
關于互動式分析的更多詳細資訊,可前往
互動式分析官網檢視。
同時也歡迎大家進入互動式分析的釘釘交流群,技術專家實時線上為您解決問題。