天天看點

Hbase重要概念詳述

Hbase Master的主要作用:

1.為Region Server 配置設定 Region。

2.負責Region Server 的負載均衡。

3.發現失效的Region Server并重新配置設定其上的Region。

4.管理使用者對table 的增删改查操作。

HBase的特點:

1.大:一個表可以有數十億行,上百萬列。

2.無模式:每行都有一個可排序的主鍵和任意多的列,列可以

根據需要動态的增加,同一張表中不同的行可以有截然不同的列。

3.面向列:面向列(族)的存儲和權限控制,列(族)獨立檢

索。

4.稀疏:對于空(null)的列,并不占用存儲空間,表可以設計

的非常稀疏;

5.資料多版本:每個單元中的資料可以有多個版本,預設情況

下版本号自動配置設定,是單元格插入時的時間戳。

6.資料類型單一:Hbase中的資料都是字元串,沒有類型。

Hbase中zookeeper的作用,以及Zookeeper的引入帶來的好處:

1.保證任何時候,叢集中隻有一個master。

2.存貯所有Region的尋址入口。

3.實時監控Region server的上線和下線資訊。并實時通知給Master。

4.存儲HBase的schema和table中繼資料 。

好處:Zookeeper的引入使得Master不再是單點故障。

Hbase中以下幾個術語:

Row Key

Column family

Column

Cell

Version number

Row Key:可以看成表中每條記錄的主鍵,友善快速查找。

Column family:擁有一個名稱,包含一個或多個相關的列。

Column:屬于某一個Column family,包含在某一列中。

Cell:通過Row Key、Column family和Column 可以定位到該cell。

Version number:cell 中存放了多個版本的内容,每個row key 唯一,預設系統時間戳

Hbase中Region Server定位的基本流程: