HBase是建立在Hadoop檔案系統之上的分布式面向列的資料庫。它是一個開源項目,是橫向擴充的。
HBase是一個資料模型,類似于谷歌的大表設計,可以提供快速随機通路海量結構化資料。它利用了Hadoop的檔案系統(HDFS)提供的容錯能力。
它是Hadoop的生态系統,提供對資料的随機實時讀/寫通路,是Hadoop檔案系統的一部分。
人們可以直接或通過HBase的存儲HDFS資料。使用HBase在HDFS讀取消費/随機通路資料。 HBase在Hadoop的檔案系統之上,并提供了讀寫通路。
HDFS
HBase
HDFS是适于存儲大容量檔案的分布式檔案系統。
HBase是建立在HDFS之上的資料庫。
HDFS不支援快速單獨記錄查找。
HBase提供在較大的表快速查找
它提供了高延遲批量處理;沒有批處理概念。
它提供了數十億條記錄低延遲通路單個行記錄(随機存取)。
它提供的資料隻能順序通路。
HBase内部使用哈希表和提供随機接入,并且其存儲索引,可将在HDFS檔案中的資料進行快速查找。
HBase是一個面向列的資料庫,在表中它由行排序。表模式定義隻能列族,也就是鍵值對。一個表有多個列族以及每一個列族可以有任意數量的列。後續列的值連續地存儲在磁盤上。表中的每個單元格值都具有時間戳。總之,在一個HBase:
表是行的集合。
行是列族的集合。
列族是列的集合。
列是鍵值對的集合。

編輯檔案<code>/etc/profile.d/hbase.sh</code>。
使HADOOP環境變量生效
編輯檔案<code>/usr/local/hbase/conf/hbase-env.sh</code>,修改如下資訊。
編輯檔案<code>/usr/local/hbase/conf/regionservers</code>,修改為如下。
編輯檔案<code>/usr/local/hbase/conf/hbase-site.xml</code>,修改為如下。
通路 http://192.168.1.200:60010/master-status
通路 http://192.168.1.201:60030/rs-status