天天看點

從OLAP走向HTAP的全能手,雲原生資料倉庫AnalyticDB通過信通院雙料認證

阿裡雲雲原生資料倉庫AnalyticDB,順利通過了分布式事務型資料庫基礎能力和性能專項評測。這也是自去年通過了信通院組織的分布式分析型資料庫基礎能力和性能專項評測後,在事務型領域取得的又一佳績。AnalyticDB也是以成為目前國内唯一一款通過分析型、事務型兩類場景的分布式資料庫産品,一款真正意義上的HTAP型産品。

1、從OLTP/OLAP走向HTAP

在傳統資料使用場景中,通常可劃分為兩個領域:聯機事務處理(簡稱:OLTP)和聯機實時分析(簡稱:OLAP)。前者是事件驅動、面向應用的。其特征是前台接收的使用者資料可以立即傳送到計算中心進行處理,并在很短的時間内給出處理結果,是對使用者操作的快速響應。例如銀行類、電子商務類的交易系統就是典型的OLTP系統。

後者OLAP是面向資料分析的,也稱為面向資訊分析處理過程。它使分析人員能夠迅速、一緻、互動地從各個方面觀察資訊,以達到深入了解資料的目的。其特征是應對海量資料,支援複雜的分析操作,側重決策支援,并且提供直覺易懂的查詢結果。例如資料倉庫是其典型的OLAP系統。兩者簡單對比如下:

從OLAP走向HTAP的全能手,雲原生資料倉庫AnalyticDB通過信通院雙料認證

面對上述複雜多變場景,是由單一平台還是多平台來處理呢?一般來說,專有系統性能更好,是以應采用多平台模式。但随着近年來軟硬體技術發展和需求變化,未來整合的趨勢更為明顯。通用化內建資料平台将能滿足絕大多數使用者的場景,隻有極少數企業需要專有系統來實作其特殊需求。

對于融合聯機事務處理和聯機實時分析的平台方案具備下面優點:

通過資料整合避免資訊孤島,便于共享和統一資料管理。

基于SQL的資料內建平台可提供良好的資料獨立性,使應用能專注于業務邏輯,不用關心資料的底層操作細節。

內建資料平台能提供更好的實時性和更全的資料,為業務提供更快更準的分析和決策。

能夠避免各種系統之間的膠合,企業總體技術架構簡單,不需要複雜的資料導入/導出等,易于管理和維護。

便于人才培養和知識共享,無須為各種專有系統培養開發、運維和管理人才。

針對上面的融合趨勢,HTAP的概念近些年來火熱起來。HTAP資料庫(Hybrid Transaction and Analytical Process,混合事務和分析處理),是2014年Gartner的一份報告中使用混合事務分析處理(HTAP)一詞描述新型的應用程式架構,以打破OLTP和OLAP之間的隔閡,既可以應用于事務型資料庫場景,亦可以應用于分析型資料庫場景。

這種架構具有顯而易見的優勢:避免繁瑣且昂貴的ETL操作,還可更快地對最新資料分析。這種快速分析資料的能力将成為未來企業的核心競争力之一。

從OLAP走向HTAP的全能手,雲原生資料倉庫AnalyticDB通過信通院雙料認證

2、AnalyticDB産品介紹

此次通過事務型、分析型雙料認證的産品—雲原生資料倉庫AnalyticDB,正是一款真正意義上的HTAP産品。産品本身基于PostgreSQL核心建構的分布式資料庫,支援ANSI SQL , 相容部分Oracle文法,支援存儲過程、觸發器、使用者自定義函數UDF等豐富文法功能,其水準擴充架構,即支援高吞吐的分布式事務處理,也支援高性能的複雜查詢分析,是阿裡雲提供的高性能分布式HTAP資料庫。

作為一款分布式資料庫産品,擴充能力尤為重要。AnalyticDB産品至今還保持着國内分布式資料庫大規模評測最高紀錄(640節點)。在性能表現上,除通過信通院分布式相關性能評測外,AnalyticDB還于上月通過标準TPC組織的TPC-H 30TB 評測認證,取得性能第一的佳績,成為國内首個通過國際 TPC-H 認證的産品。

雲原生資料倉庫AnalyticDB,經過多年積累完善趨于成熟,已服務于阿裡經濟體及衆多外部企業使用者,涵蓋金融、政府、零售、網際網路、教育等數百家客戶。

從OLAP走向HTAP的全能手,雲原生資料倉庫AnalyticDB通過信通院雙料認證

AnalyticDB PostgreSQL版基于PostgreSQL核心,分為Master協調節點和Segment資料節點。Master 負責SQL的解析和優化,并生成分布式執行計劃,發送給segment節點并行執行。Master上可分為一個Main Master和多個Secondary Master,其接受用戶端請求,并進行SQL的解析和優化。

同時Main Master建構了GTM全局事務管理子產品,維護全局統一的事務ID和目前活躍事務清單,進而實作嚴格的SERIALIZABLE、READ COMMITTED 隔離級别 ,保證各個節點間事務的強一緻性。Master節點含有Cascade架構SQL優化器,将RBO和CBO統一結合,同時可自動優化改寫關聯子查詢等複雜SQL語句,實作計算按最優的分布式計劃執行,規避複雜SQL的手工調優改寫。

計算節點 Segment可水準擴充,支援多副本存儲。表支援按行或者按列進行資料存儲。當面向交易場景時,行存儲提供高吞吐的事務處理能力,面向分析場景時,列存儲及多種索引機制等,提供高性能的聚合分析,以及資料高壓縮比。此外在既有PostgreSQL的計算引擎基礎上,開發了全新的高性能向量化計算引擎laser。

此外,AnalyticDB PostgreSQL版在既有PostgreSQL的計算引擎基礎上,開發了全新的高性能向量化計算引擎laser。通過算法設計,消除了傳統引擎火山模型、碎片化記憶體配置設定、備援邏輯等帶來的性能問題,将CPU資源用于核心計算;采用LLVM進行自動代碼生成(CodeGen),提升表達式計算性能、精簡計算邏輯,實作邏輯計算完美“瘦身”;同時充分利用新硬體特性,采用了CPU的SIMD等新技術,最大提升計算性能。

3、寫在最後

HTAP,作為近兩年頗為火爆的概念,已經逐漸從一個理論概念逐漸走向具體産品。以阿裡雲AnalyticDB通過雙料認證為代表,這一技術已逐漸成熟走向商用。相信,在不久的将來,将有更多的客戶可以從HTAP上收益,将企業内資料使用提升到新的高度。

了解“全能手”雲原生資料倉庫AnalyticDB更多精彩詳情