天天看點

天雲資料Hubble資料庫通過信通院首批HTAP資料庫産品評測

作者:天雲資料市場營運

近日,中國資訊通信研究院(簡稱“中國信通院”)公布了第十五批“可信資料庫”評測結果。天雲資料Hubble資料庫憑借過硬的技術實力順利通過“HTAP資料庫基礎能力”評測。

天雲資料Hubble資料庫通過信通院首批HTAP資料庫産品評測

天雲資料:首批通過信通院HTAP基礎能力測評的三家廠商之一

“可信資料庫"系列評估評測是中國信通院自2015年推出的權威評估評測體系,覆寫範圍包括資料庫産品及周邊工具、資料庫服務商和應用側等。本次評審會專家由來自中國信通院、中國農業銀行、郵儲銀行、光大銀行、華夏銀行、中移資訊、中國聯通等機關的專家組成,評審環節包括産品資料稽核、測試報告稽核、質詢與答疑、集中評議。在本次HTAP資料庫基礎能力評測中,天雲資料Hubble資料庫經過評審專家嚴格把關,順利通過各項環節的嚴苛考驗,技術實力備受認可,成為三家通過廠商之一。

為什麼必須提供統一支撐事務處理和工具負載分析的資料庫?網際網路的消費化,越來越強調體驗的實時性,交易和分析場景必須一緻,這對傳統資料庫的應用來說是一次巨大的更新。這不是簡單的替代邏輯,是産業鍊更新邏輯。面向新興的大資料領域,新興的資料庫依然扮演着重要角色,不僅僅可以對傳統資料庫Oracle做碾壓替代,同時還能夠勝任大資料領域的剛需。而在整個市場的需求上,Hubble資料庫的自身定位就具有天然優勢。天雲資料憑借其多年來在大資料分布式計算領域的經驗以及多家大型銀行的實踐最終通過引入損失函數動态評價SQL邏輯計劃的執行成本、CBO代價優化解析、Sharding切片線程級别實體資源比對不同計算負載、TP和AP雙引擎排程執行、随機和序列化IO對存儲的通路、依靠資料副本機制同時支援KV鍵值存儲和列存存儲交出了完美的答案。這意味着一張表可以同時支援行存和列存,真正的融合了存儲結構,避免了在交易和分析資料庫間每夜ETL資料搬家的繁瑣運維工作和資料備援,提供統一支撐事務處理和工具負載分析。

Hubble資料庫:100%Go語言的資料庫

C語言、Java語言都是業界的主流語言,為什麼天雲資料會選擇Go語言?因為C語言在工程化能力上有其短闆,Java語言基于JVM虛拟機技術在性能上會受到制約。在資料庫産品線,天雲資料團隊早期沿着HBase技術路徑探索。後創立天雲資料公司後,面對銀行A類核心系統ACID 的事務需求,以及銀監會要求的兩地三中心容災要求,團隊開始面向交易體系進行分布式計算的原創路徑探索,Hubble資料庫重寫了HBase存儲引擎,采用Go語言研發,更适于服務化的雲原生時代。相比于C語言、Java語言,Go語言在工程化能力以及性能上都是最适合天雲資料的,可以實作邏輯層、排程層、計算層、存儲層的更小顆粒度的解析。天雲資料就是站在Google這樣巨人的肩膀上,卸掉了C語言的包袱,快速地奔跑。

簡單做一個運維量評估:C/C++ 100萬行代碼約等于Java60-70萬代碼,對應到Go語言大概也就是20~30萬行代碼,其運維量可見一斑。

但目前整體市場上, 80%以上的産品語言是Java,能實作50%Go語言的也是鳳毛麟角。Hubble 資料庫100%基于GO語言編寫,可編排、可排程、運維量小,适合雲原生時代,彈性伸縮,按需配置設定。

HTAP技術之後,資料庫的技術方向應該是什麼?

曆史上很多重大制度或秩序,都由技術創新推動。例如威尼斯商人建立的複式記賬法,在現金流之上建立了現代社會“資本”這—重要要素;荷蘭海上馬車夫設計的Loca可投資的獨立船艙單元, 奠定了現代公司股權治理結構。資料, 作為土地,勞動力,資本之後的第四要素,一定有科技要素的配套作為制度保障。資料作為創新生産要素,必然配套制度創新。

網際網路帶來了産銷合一,越來越多的資料并不是面向宏觀趨勢的供給,做報表、做管理駕駛艙、做儀表盤、上大屏,供給上司決策分析。網際網路帶來了個性化服務,淘寶推薦引擎、千人千面個性化結果,要跑的是貝業斯網絡、是協同過濾算法,是這些算法再替代SQL的可視化服務。

是以怎麼能夠在同一個計算的庫體上,面向機器學習的操作面向新興的資料驅動業務的算法?AI内生資料庫是一個必然要走的路徑。尤其是應對産業網際網路,第三波的機器資料生産,更多的物聯網的機器生産、傳感器,他的機器資料實體意義人了解越來越難,比如油壓、溫度、結蠟、工況都是一些科學屬性。這些資料它很難用決策,因為它對人類來說需要更強的科學知識才能去了解。是以将會是機器生産資料,機器消費資料。

軟體實力是邁向智能的基石。數字經濟已成為全球經濟增長的新引擎,資料是未來最重要的生産資料,對應的生産工具必然要同步更新。AI-Native資料庫通過更多的邏輯計劃豐富資料消費能力和形态,是面向服務的融合,通過将資料庫智能化在AI計算的過程中降低門檻和成本,同時也可以充分地釋放資料庫的計算資源,進一步突破行業天花闆,形成更大産業規模。當AI的資料消費替代了可視化資料消費成為主流,資料資料的生産工具必須是AI原生的AI-Native資料庫。

繼續閱讀