天天看點

【大資料技術】什麼是HBase ?所有的基礎都在這兒了

2006 年10 月Google 釋出三架馬車之一的《Bigtable:A Distributed Storage System for Strctured Data》論文之後,Powerset 公司就宣布 HBase 在 Hadoop 項目中成立,作為子項目存在。後來,在2010 年左右逐漸成為 Apache 旗下的一個頂級項目。可能是實際應用中包裝得太好,很多人對于 HBase 的認識止步于 NoSQL 。今天,螞蟻金服的南俊從基礎開始講起,希望有助于增強大家在實際業務中對 HBase 的了解。

一、 HBase 簡介

HBase 名稱的由來是由于其作為 Hadoop Database 存在的,用來存儲非結構化、半結構化資料。對大資料以及人工智能概念都是模糊不清的,該按照什麼線路去學習,學完往哪方面發展,想深入了解,想學習的同學歡迎加入大資料學習交流裙:%52%21【89】最後307,有大量幹貨(零基礎以及進階的經典實戰)分享給大家,并且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國内最完整的大資料高端實戰實用學習流程體系 。從java和linux入手,其後逐漸的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關知識一一分享!

要想知道 HBase 的用途,就需要看一看其在 Apache 的 Hadoop 生态系統中的位置,可以看到 HBase 是建構在 HDFS 之上的,這是由于 HBase 内部管理的檔案全部都是存儲在 HDFS 當中的。同時,MapReduce 這個計算架構在 HBase 之上又提供了高性能的計算能力來處理海量資料。此外還有一些像 Pig、Hive 用來提供高層語言的支援。還有 Sqoop 用來完成傳統資料庫到 HBase 之間的資料遷移。類似衍生出來的新技術還有很多,有興趣的同學可以自己去了解一下。

Google 的三架馬車 BigTable、GFS、MapReduce 現在在開源社群中都能找到對應的實作。HBase 就是 Bigtable 的開源實作,當然這句話不是完全正确,因為兩者之間還是有些差異的。但是主要還是基于 BigTable 這個資料模型開發的,是以也是具有 Key-Value 特征的,同時也就具有 Bigtable 稀疏的、面向列的這些特性。

也是由于 HBase 利用 HDFS 作為它的檔案系統,是以它也具有 HDFS 的高可靠性和可伸縮性。和 Hadoop 一樣,HBase 也是依照橫向擴充,通過不斷地通過添加廉價的伺服器來增加計算和存儲的能力。BigTable 利用 Chubby 來進行協同服務,HBase 則是利用 Zookeeper 來對整個分布式系統進行協調服務。正是因為通過HDFS 的高可靠可伸縮性,以及應用了 Bigtable 的稀疏的面向列的這些高效的資料組織形式。是以 HBase 才能如此地适合大資料随機和實時讀寫。

二、 HBase 基本概念

這裡介紹一下 HBase 的一些基本概念:

RowKey(行鍵),顧名思義也就是我們在關系型資料庫中常見的主鍵,它是Unique 的,在 HBase 中這個主鍵可以是任意的字元串,其最大長度是64K,在内部存儲中會被存儲為位元組數組,HBase 表中的資料是按照 RowKey 的字典序排列的,例如很多索引的實作,包括地理空間索引很大程度就是依賴這個特性。

不過也要注意一個點,現實當中期望排序是1、2、3、4...10,而在 HBase 中1 後面緊跟的會是10。是以,在設計行鍵的時候一定要充分地利用字典序這個特性,将一下經常讀取的行存儲到一起或者靠近,減少Scan 的耗時,提高讀取的效率。這裡一定要說的一點是,行鍵設計真的很重要,例如做組合行鍵時将時間排前面,導緻寫熱點(曾經踩過的坑,記憶猶新)。

Column Family(列族),它是由若幹列構成,是表 Schema 的一部分,是以需要在建立表的時候就指定好。但也不是所表建立完之後就不能更改列族,隻是成本會比較大,是以不建議更改。HBase 中可允許定義的列族個數最多就20多個。列族不僅僅能夠幫助我們建構資料的語義邊界,還能有助于我們設定某些特性,比如可以指定某個列族内資料的壓縮形式。一個列族包含的所有列在實體存儲上都是在同一個底層的存儲檔案當中。

Column (列),一般都是從屬于某個列族,跟列族不一樣,列的數量一般的沒有強限制的,一個列族當中可以有數百萬個列,而且這些列都可以動态添加的。這也是我們常說的 HBase 面向列的優點,不像傳統的關系型資料庫,調整一下 Schema 都需要擔心對于生産的影響。

Version Number(版本号),HBase 中每一列的值或者說是每個單元格的值都是具有版本号的,預設使用的系統目前的時間戳,精确到毫秒。當然也可以是使用者自己顯式地設定,我們是通過時間戳來識别不同的版本,是以如果要自己設定的話,也要保證版本号的唯一性。使用者也可以指定儲存指定單元格的最後 N 個版本,或者某個時間段的版本,這個是可以在配置中配置的。一個單元格裡面是資料是按照版本号降序的。也就是說最後寫入的值會被最先讀取。

Cell(單元格),一個單元格就是由前面說的行鍵、列标示、版本号唯一确定的,這裡說的列标示包括列族和列名。Cell 中的資料是沒有類型的,全部都是位元組碼。

三、HBase 表邏輯視圖

由于 HBase 表的一個單元格是由多元決定的,我這裡嘗試用一個二維的電子表格來展示。可以結合前面說的 HBase 的基本概念來了解。可以看到通過二維表格來展示一個成績表,中間有很多單元格是空的,整體看起來很稀疏,需要說明的是在 HBase 的實際存儲中這些空的單元格并不占存儲。

四、HBase 表實體視圖

實體視圖比較複雜,下面以圖來展示一個 HBase 表從宏觀到微觀到實體存儲。盡量以最簡單到方式展示實體視圖的幾個層次。

表的橫向切分(TableRegion)

Region 的分裂

Region 的分布

Region 的存儲結構

一個 Region 是由一個或多個 Store 組成。每一個 Store 其實就是一個列族。每個

Store 又是由一個 memStore 和 0 個或者多個 storeFile 組成。memStore 是存儲在記憶體中,storeFile 是存儲在 HDFS 中,有時候也稱作 HFile。資料都會先寫入memStore,一旦 memStore 超過給的的最大值之後,HBase 就會将memStore 持久化為 storeFile。

五、HBase 叢集結構

一個 HBase 叢集一般由一個 Master 和多個 RegionServer 組成。

用戶端庫:可以通過 HBase 提供的各式語言API 庫通路叢集。API 庫也會維護一個本地緩存來加快對 HBase 對通路,比如緩存中記錄着 Region 的位置資訊。

Maste 節點:主要為各個 RegionServer 配置設定 Region,負責 RegionServer 對負載均衡,管理使用者對于 Table 對 CRUD 操作。

RegionServer:維護 Region,處理對這些 Region 對IO 請求,負責切分在運作過程中變過大的 Region。