天天看點

Hadoop 部署之 HBase (四)一、HBase是什麼二、HBase 叢集部署三、HBase 配置(namenode01)四、HBase 啟動

HBase是建立在Hadoop檔案系統之上的分布式面向列的資料庫。它是一個開源項目,是橫向擴充的。

HBase是一個資料模型,類似于谷歌的大表設計,可以提供快速随機通路海量結構化資料。它利用了Hadoop的檔案系統(HDFS)提供的容錯能力。

它是Hadoop的生态系統,提供對資料的随機實時讀/寫通路,是Hadoop檔案系統的一部分。

人們可以直接或通過HBase的存儲HDFS資料。使用HBase在HDFS讀取消費/随機通路資料。 HBase在Hadoop的檔案系統之上,并提供了讀寫通路。

HDFS

HBase

HDFS是适于存儲大容量檔案的分布式檔案系統。

HBase是建立在HDFS之上的資料庫。

HDFS不支援快速單獨記錄查找。

HBase提供在較大的表快速查找

它提供了高延遲批量處理;沒有批處理概念。

它提供了數十億條記錄低延遲通路單個行記錄(随機存取)。

它提供的資料隻能順序通路。

HBase内部使用哈希表和提供随機接入,并且其存儲索引,可将在HDFS檔案中的資料進行快速查找。

HBase是一個面向列的資料庫,在表中它由行排序。表模式定義隻能列族,也就是鍵值對。一個表有多個列族以及每一個列族可以有任意數量的列。後續列的值連續地存儲在磁盤上。表中的每個單元格值都具有時間戳。總之,在一個HBase:

表是行的集合。

行是列族的集合。

列族是列的集合。

列是鍵值對的集合。

Hadoop 部署之 HBase (四)一、HBase是什麼二、HBase 叢集部署三、HBase 配置(namenode01)四、HBase 啟動

編輯檔案<code>/etc/profile.d/hbase.sh</code>。

使HADOOP環境變量生效

編輯檔案<code>/usr/local/hbase/conf/hbase-env.sh</code>,修改如下資訊。

編輯檔案<code>/usr/local/hbase/conf/regionservers</code>,修改為如下。

編輯檔案<code>/usr/local/hbase/conf/hbase-site.xml</code>,修改為如下。

通路 http://192.168.1.200:60010/master-status

Hadoop 部署之 HBase (四)一、HBase是什麼二、HBase 叢集部署三、HBase 配置(namenode01)四、HBase 啟動

通路 http://192.168.1.201:60030/rs-status

Hadoop 部署之 HBase (四)一、HBase是什麼二、HBase 叢集部署三、HBase 配置(namenode01)四、HBase 啟動

繼續閱讀