天天看點

HBase2.0商用首發--有哪些值得期待的新特性

阿裡雲HBase 2.0成長手記

HBase本身是一個分布式存儲、資料庫引擎,可以支援千萬的QPS、PB級别的存儲,這些都已經在生産環境驗證,并且在阿裡得以驗證。

早在2010年開始,阿裡巴巴集團開始研究并把HBase投入生産環境使用,從最初的淘寶曆史交易記錄,到螞蟻安全風控資料存儲,HBase在幾代阿裡專家的不懈努力下,已經表現得運作更穩定、性能更高效,内部HBase叢集超過萬台的規模,單叢集超過千台,是集團核心資料庫産品之一,也是國内甚至國際上絕對的HBase大戶。

為什麼HBase會受到大客戶的青睐。首先在這個上雲的時代,在雲上,對于引擎最為核心的就是存儲計算分離,存儲可以按需計費,起碼得彈性伸縮。計算則按節點存儲提供,完全按照QPS計費,要麼費用高得吓人,要麼難以滿足更多的場景。

比如存儲10M,到底算一次QPS,還是多少次。 由于HBase天生就是存儲計算分離,天然比較适配雲上的架構,可以說到了雲上,HBase更加具有優勢。

是以國内大型網際網路企業内部都有大量的HBase叢集,尤其阿裡更甚。自2012年誕生第一位“東八區” HBase committer,到今天,阿裡巴巴已經擁有3個PMC,6個committer,是中國擁有最多HBase committer的公司,其中HBase核心中超過200+重要的feature是阿裡貢獻。除了擁有強大的核心團隊和核心能力,HBase在内部經過雙十一等超級業務的千錘百煉,鍛煉出一系列的完善的産品形态和企業級能力。

潛心修煉八年,終成HBase2.0

基于阿裡長達8年和超萬台實踐經驗和技術積累的延伸,ApsaraDB for HBase在基于社群的HBase的基礎上,推出了雲HBase服務。建立在阿裡雲龐大生态體系下,根據雲環境生态和HBase存儲系統的特點,推出适合企業嚴苛要求的雲HBase存儲系統。

HBase2.0在性能,穩定性上做了一系列核心架構級别優化。這次阿裡雲基于社群HBase2.0穩定版本基礎上,進行了進一步一系列性能和穩定性優化和測試驗證。

此次首發雲HBase2.0雲服務,讓使用者可以第一時間體驗到阿裡技術加持的HBase 2.0新版本。

雲資料庫HBase2.0産品架構

HBase2.0商用首發--有哪些值得期待的新特性

對比優勢

HBase2.0商用首發--有哪些值得期待的新特性

首先是針對企業不同的使用環境,不同的SLA訴求,雲HBase一共提供3個版本,分别滿足開發環境,線上業務,以及金融級業務的訴求。單節點版本,低廉的價格用于開發測試場景,叢集版本,99.9%可用,滿足企業線上業務訴求,支援最高5000萬的QPS和10P的資料。還有支援金融級高可用的雙活版本。所有版本都支援11個9的資料可靠性,無需擔心資料丢失。

HBase2.0商用首發--有哪些值得期待的新特性

除了完善的産品形态,針對企業應用中成本、安全、穩定性、易用性等諸多訴求,阿裡雲HBase提供了強大的能力,例如存儲計算分離,按需彈性能力; 資料備份恢複能力;資料冷熱分離和分級存儲能力;SQL接口和強大的二級索引和反向索引能力;多層次安全能力等等。

細數ApsaraDB HBase典型場景

HBase2.0商用首發--有哪些值得期待的新特性

雲HBase已經通過阿裡雲的公共雲、專有雲及混合雲的形态對外服務,使用者覆寫社交、金融、車聯網、物流、零售、電商、共享出行等數十個行業,幫助使用者頂住千萬級QPS的業務壓力,以及PB級資料高效存儲和處理。

HBase2.0支援多region replicas服務,充分利用叢集資源支援更高并發随機讀。進一步加強了HBase高并發多讀能力,是以非常适合車聯網等物聯網場景。

除了在物聯網場景的應用,我們知道不少的頭條類、新聞類的的新聞、網頁、圖檔存儲在HBase之中。HBase2.0支援中等對象存儲,相容原生api讀寫通路以及bulkload等,合适企業存儲一些附件文檔、圖檔資料,而不需要企業另選其它對象存儲系統,大大簡化企業背景資料架構。在存儲上支援各類資料,包括日志、訂單、交易資料、消息等,線上實時寫入,實時查詢。

通過對讀寫全鍊路優化,rpc改進等,比随機讀寫延時更低。同時滿足了金融級分控,推薦等核心場景的極緻時延和穩定性要求。

總結:曆經近8年的技術沉澱,阿裡巴巴大資料NoSQL資料庫處理技術的精華沉澱在HBase上,後者成功支撐了成功支撐了阿裡經濟體中最大的NoSQL業務體量,是阿裡大資料處理技術的核心組成部分,目前将這項技術應用到廣大企業中,助力企業發現資料價值。