天天看點

《MapReduce 2.0源碼分析與程式設計實戰》一第2章 入門

本節書摘來異步社群c書中的第2章,第2.1節,作者: 王曉華 責編: 陳冀康,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

hbase實戰

本章涵蓋的内容

連接配接到hbase和定義表

與hbase互動的基本指令

hbase的實體資料模型和邏輯資料模型

基于複合行鍵的查詢

下面幾章的一個目标是教你如何使用hbase。作為一名應用開發人員,首先你要适應hbase的特性。你将學習hbase的邏輯資料模型(logical data model),通路hbase的各種方式,以及如何使用這些api的細節。另外一個目标是教你進行hbase模式(schema)設計。hbase有着和以往關系型資料庫不同的實體資料模型(physical data model)。我們将介紹一些hbase實體模型的基本原理,以便設計資料模型時你能夠利用它對自已的應用系統進行優化。

為了完成這些目标,你将從頭開始搭建一個應用系統。請允許我們給你介紹一下完全建立在hbase上的twitbase,它是社交網絡twitter的簡化克隆版。我們不會實作twitter的所有功能,而且這也不是一個準備投入使用的系統。我們隻是把twitbase看做twitter的初級原型産品。twitbase和twitter早期版本的主要差別是,twitbase設計中考慮了可擴充性,是以需要依賴資料存儲來實作這一點。

本章從基本原理開始講起。你會看到如何建立hbase表,如何導入資料和讀取資料。我們将介紹hbase處理資料的基本操作,以及資料模型的基本元件。同時,你會學到一些hbase的内部工作機制。這些知識可以幫助你在模式設計時作出正确決定。本章是學習hbase和其餘章節的起點。