天天看點

Hadoop專欄(二)———分布式資料塊HBase

一、HBase簡介

說起Hbase,就必須說到BigTable,BigTable是當初谷歌為了處理網頁設計的一種處理手段

Hadoop專欄(二)———分布式資料塊HBase

網頁搜尋主要内容包括建立網頁的索引和搜尋網際網路網頁

Hadoop專欄(二)———分布式資料塊HBase

BigTable的誕生

Hadoop專欄(二)———分布式資料塊HBase

底層分布式檔案系統存儲完全非結構化的資料

HBase則允許幾千台伺服器去存儲海量檔案

Hadoop專欄(二)———分布式資料塊HBase
Hadoop專欄(二)———分布式資料塊HBase
Hadoop專欄(二)———分布式資料塊HBase

HBase和BigTable的底層技術對應關系

Hadoop專欄(二)———分布式資料塊HBase

主從複制

分庫來實作資料塊性能提升

Hadoop專欄(二)———分布式資料塊HBase

為什麼還要去設計HBase這麼一個資料塊産品呢

雖然已經有了HDFS和MapReduce,但是Hadoop主要解決大規模資料離線批處理Hadoop是沒有辦法滿足大資料實時處理需求的随着這些年資料的大規模爆炸式增長,傳統關系型資料庫的擴充能力非常有限

這樣操作有兩個缺陷,一個是不便利,另一個是效率非常低Hbase和傳統的關系資料庫有什麼練習和差別?

資料類型方面:傳統的關系型資料庫用的是非常經典的關系型資料庫模型

資料操作方面:在關系資料庫當中定了非常多的資料操作

存儲模式方面:關系資料庫是基于行模式存儲,而對于HBase來講是基于列存儲

在資料索引方面:關系資料庫可以直接針對各個不同的列,建構非常複雜的索引

Hadoop專欄(二)———分布式資料塊HBase

資料維護方面:在關系資料庫當中做一些資料更新操作的時候,實際上裡面舊的值會被新的值覆寫掉

可伸縮性方面:關系資料庫是很難實作水準擴充的,最多可以實作縱向擴充

Hadoop專欄(二)———分布式資料塊HBase
Hadoop專欄(二)———分布式資料塊HBase

二、Hbase資料模型

三、Hbase的實作原理

四、Hbase運作機制

五、Hbase程式設計實踐