天天看點

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

根據Gartner的預測,全球非關系型資料庫(NoSQL)在2020~2022年預計保持在30%左右高速增長,遠高于資料庫整體市場。

阿裡雲資料庫HBase版也是踏着技術發展的節奏,伴随着NoSQL和大資料技術的興起和發展,從2010年開始研究和發展。

時光荏苒,日月如梭,轉眼九年時間,在阿裡雲上直接開放提供服務也有1年多時間,并在去年的12月份全新釋出X-Pack,将單一的HBase演進到一個完整的資料處理平台的能力。我們注意到還有很多同學和客戶不清楚HBase X-Pack是什麼,什麼場景下合适選擇HBase X-Pack。

首先我們先來看下HBase X-Pack的定位:

  • HBase X-Pack是基于HBase及HBase生态建構的 低成本一站式資料處理平台。
  • HBase X-Pack支援:HBase API(包括RestServerThriftServer)、關系Phoenix SQL、時序OpenTSDB、全文Solr、時空GeoMesa、圖HGraph、分析Spark on HBase,是阿裡雲首個支援多模式的分布式資料庫,且協定100%相容開源協定。
  • HBase X-Pack實作資料從處理、存儲到分析全流程閉環,讓客戶用最低成本實作一站式資料處理。

接下來一起來梳理一下阿裡雲HBase X-Pack關鍵能力,一起看看選擇阿裡雲HBase X-Pack的十個理由。

理由一:一體化資料處理平台

提供一站式能力

企業數字化轉型時代,業務越來越複雜,需要一個平台可以提供一站式處理能力。傳統大資料各個元件非常多,各個元件分層發展,給擴充性帶來非常大的便利,但同時也引入了非常高的技術門檻。

雲HBase X-Pack通過內建Spark,Solr,HBase,時序,時空,圖等元件,打通各個元件之間的資料同步,通過資料工作台提供統一一體化互動式的操作體驗,實作計算、存儲、分析、檢索、機器學習五位一體的一站式能力,極大的降低了使用門檻,輕松上手,同時提供全托管的服務,避免各種複雜的運維和技術坑。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

雲HBase X-Pack詳細的能力可以通路雲HBase的幫助,裡面有各個能力詳細的介紹:

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由二:深厚的技術積累

企業決策選擇雲服務,最核心的一個因素就是降低TCO,最看重的核心因素就是背後的技術力量,服務能力。

阿裡雲HBase X-Pack經過9年的發展,積累強大的專家團隊,目前擁有國際認證7個committer,4個PMC,擁有國内獨一無二的技術實力。

我們擁有集團超過萬台的服務經驗,對各種異常場景,資料可靠性,可用性,性能,資料遷移各個方面有全套的服務和工具。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由三:獨家企業版本,以及最新2.0版本

阿裡雲HBase提供的版本是經過、千錘百煉的企業版本,在穩定性和性能上遠勝于開源的版本,并且全球首家提供最新2.0版本。

關于阿裡雲HBase發展曆程,可以看這裡詳細介紹:

https://yq.aliyun.com/articles/601531

阿裡雲HBase和開源版本的關鍵差別,可以檢視:

https://help.aliyun.com/document_detail/49502.html

理由四:開發效率最高的資料庫

Gartner在2017年資料庫廠商推薦報告中就明确指出多模是發展趨勢阿裡雲新釋出X-Pack更是将多模推上新高度,KV的基礎上,同時支援時序、時空、圖、文檔等多種資料模型。

我們知道,大資料時代,業務多樣性是大資料的本質之一,強制使用單一模型隻會降低生産效率,HBase X-Pack提供KV、SQL、時序、時空、圖豐富的多模多模能力,幫助客戶可以根據不同的業務選擇不同的資料處理模型,支援業務靈活選擇,進而實作最高效率的開發和生産。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由五:做成本最低的資料庫

HBase誕生于Google的bigtable論文,天然是為了存儲海量網際網路資料而誕生,低成本能力是其天然的屬性。雲HBase X-Pack在繼承HBase自身能力的同時,為了給客戶節省成本做了很多努力。展現在核心,整體方案各個方面,主要有:

  • 雲HBase版本的核心是經過優化的,性能平均高出自建版本30%~300%:

    如果對性能有要求的場景,就可以節省更少的CPU資源,擷取更大的效果,具體可以參考

    https://yq.aliyun.com/articles/198654
  • 齊全的産品形态,滿足各種業務場景,提供最高成本效益:

    HBase X-Pack支援單節點,叢集版本,跨可用區/跨地域雙叢集版本,滿足使用者從測試,生産環境,高可用各種使用環境,平衡能力和成本,提供高成本效益的選擇,具體可以參考

    https://help.aliyun.com/document_detail/71538.html
  • 提供資料全生命周期管理功能,資料冷熱分離,存儲成本下降3.5倍:

    很多場景裡面,資料有冷熱的需求,我們提供不同的存儲媒體,包括OSS,本地盤,雲盤,高性能雲盤,幫助客戶實作最佳的存儲成本,詳細的可以看下

    https://yq.aliyun.com/articles/646983
  • 客戶基于ECS自建,存儲選擇雲盤,hdfs副本數天然是3副本:

    HBase服務通過和雲盤深度內建2副本就可以同樣的性能和可靠性。在存儲上天然節省1/3,詳細的可以通路

  • 全托管服務,提供代維,99.9%的SLA:

    運維在日常資料庫工作中占了很大的比重,而且資料庫的穩定性關系到整個系統,牽一發和動全身,雲HBase X-Pack提供全托管的服務,給客戶節省運維費用,以及極大的避免故障帶來的損失。

  • 提供一體化的方案節省成本:

    雲HBase X-Pack通過把各個元件深度內建和融合,通過組合各個産品之間的能力,給很多場景帶來增效,解決了性能瓶頸的同時,帶來成本的下降。這裡舉2個典型的例子:

1.很多人工智能,多媒體場景,線上教育裡面,大量圖檔、小視訊檔案。傳統的使用方法都是存在OSS裡面,OSS天然并發和時延處理能力有限,同時讀寫都是要收費的,讀寫次數越多,費用越高,使用HBase X-Pack沒有這部分的費用,可以解決性能的瓶頸的同時,帶來綜合成本的降低。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

2.碰到非結構化資料查詢的訴求時,大家一般會想起ES。ES适合文本查詢,入庫會比較差(一般就幾百條/S),查詢函數也有限。HBase X-Pack通過支援Solr完全補齊了文本查詢的能力。

同時Phoneix+solr組合結合了HBase和搜尋的兩者的優勢,在吞吐和并發上有優勢。對SQL的易用性也有優勢。尤其是在新零售等場景,一張表中混雜結構化字段和非結構化字段,可以根據需求,自動建立索引,融合兩者的優勢。倒排膨脹率很高,入庫會極速下降。大部分客戶隻是部分字段有模糊查詢的需求,ES強制所有的用單一技術。Phoneix非常适合并發高的查詢,條件不多。搜尋技術補充了索引技術,适合各種條件。通過結合phoneix+solr成功平滑查詢和存儲性能,提高性能的同時,存儲成本也下降幾倍,非常适合結構化+非結構化混合的場景。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由六:力争做最好用的資料處理平台

HBase主要提供線上查詢能力,沉澱下來的資料需要使用Spark來做複雜分析,HBase X-Pack中的Spark為了讓使用者更便捷的做資料處理,産品上面提供了以下能力:

1)資料工作台:支援互動式、作業管理、工作流、資源管理、中繼資料管理,從測試、開發、上線一站式開發體驗

2)spark内置connector:一鍵關聯hbase、mongo、redis、rds等叢集,免去調試的煩惱,更加便捷的分析其他資料庫的資料

3)支援多語言:可以選擇習慣的語言進行程式設計

4)可維護性:支援小版本更新、監控、報警,免去Spark叢集維護

5)離線數倉能力:一鍵歸檔線上庫rds、polardb、mongo、hbase、cassandra資料到Spark數倉

6)成本:叢集預設存儲為叢集版本HDFS,同時支援資料存儲在oss降成本

使用HBase X-Pack Spark能夠建構業界成熟的一體化資料處理平台,支撐推薦、風控、離線數倉、實時處理及計算、大資料營運、日志分析、去oracle複雜分析等業務場景:

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由七:資料可靠性作為重中之重

對大多數公司來說資料的安全性以及可靠性是非常重要的,如何保障資料的安全以及資料的可靠是大多數資料庫必須考慮的。2016 IDC的報告表示資料的備份(data-protection)和資料恢複(retention)是NoSQL的最基礎的需求之一,阿裡雲NoSQL資料庫也一直把怎麼保障客戶的資料安全放在首位。

以雲HBase為例,傳統資料庫備份恢複的能力都是TB級别,在交易等場景下面是足夠的,但面向大資料場景就捉襟見肘了。雲HBase通過垂直整合高壓縮、核心級優化等能力,将備份恢複的量級成功推高百倍以上,做到 百TB級别甚至更高 ,讓客戶在大資料量場景下也無後顧之憂。

雲HBase支援全量(備份集)備份、全量(備份集)恢複、增量(實時)備份、增量(時間點)恢複完整備份恢複能力。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由八:單叢集3個9高可用

雙叢集4個9高可用

HBase通過核心加強,一系列自動運維修複工具,單叢集可以提供3個9的可用性,為了滿足很多場景下面更高可用性的要求,雲HBase支援跨可用區或者跨地域雙叢集主備同步,可以讓多個HBase叢集保持同步關系。

在一個叢集出現故障的時候,迅速地将業務切換至另外一個叢集進而避免故障。HBase主備之間資料的同步基于異步鍊路實作,遵循最終一緻性協定,典型的主備同步延遲在200ms左右。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由九:大量場景驗證,久經考驗

阿裡雲HBase從10年上線以來,在阿裡集團内部久經考驗,超過12000台伺服器,單叢集超過2000台的規模應用。

雲HBase自釋出以來,通過豐富的能力,優秀的全托管能力,全面超越同類産品的技術能力得到金融、社交、多媒體、新零售、車聯網網、制作業、政企等等多個行業,多上千個客戶的信賴,積累了大量的使用經驗。歡迎我們的新老客戶通路首頁擷取更多的資訊:

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

理由十:提供不停機遷移服務

讓自建遷移無憂

客戶已經使用ECS自建服務,想使用雲HBase服務,最擔心的應該還是遷移過程中對業務的影響,技術團隊充分考慮這一點,提供免費的不停機遷移服務,對線上業務0影響,資料遷移一行不丢。目前業界有能力提供不提供不停機遷移HBase服務的僅此一家。

NoSQL | 選擇阿裡雲資料庫HBase版十大理由

本文簡單梳理了阿裡雲HBase X-Pack十大理由,希望能對大家了解雲HBase有一個幫助,另外也給您選型做一個充分的參考。當然我們還有很多改進的空間,我們還在成長的路上持續努力,也歡迎大家聯系我們提出寶貴的意見。

最後福利,歡迎使用雲HBase X-Pack版本,針對首次購買的使用者推出了雲資料庫HBase單節點獨享規格,歡迎大家申請試用:

https://promotion.aliyun.com/ntms/act/hbasefree.html