HBase的是建立在Hadoop的Apache的開源的NoSQL資料庫,提供了大量的非結構化和半結構化資料的随機存取和強大的一緻性。它是仿照谷歌的BigTable是一個列面向家庭的資料庫。資料被存儲在一排内的表和資料的行是由列族分組。 HBase的是在這個意義上,無論是列也不存儲在其中的資料類型需要在使用它們之前所定義的模式的更小的資料庫。開放源代碼是首次釋出由Mike Cafarella于2007年,線性擴充處理PB級資料數千個節點。它可以依靠資料備援,批處理和通過在Hadoop的生态系統的分布式應用程式提供的其他功能。
HDInsight HBase的是提供一個管理的叢集內建到Azure的環境。叢集被配置為直接在Azure的Blob存儲,這提供了在性能/成本的選擇低延遲和增加的彈性存儲資料。這使客戶能夠建立一個大型資料集工作的互動式網站,建構存儲傳感器和遙測資料,從數以百萬計的端點的服務,并分析這些資料與Hadoop作業。 HBase的和Hadoop的都是很好的出發點,在Azure的大資料項目,特别是,可以實作實時應用與大型資料集工作。
BigTable的,并推而廣之,HBase的建立為其典型使用案例就是網絡搜尋。搜尋引擎建立一個映射條款,包含它們的網頁索引。但也有許多其他的用例HBase的适合哪幾個的,都逐項列出在本節。
HBase的可作為一個鍵值存儲,适用于管理資訊系統。 Facebook的使用HBase的為自己的郵件系統,它是理想的存儲和管理網際網路通信。 WebTable使用HBase的搜尋和管理從網頁中提取表。
HASE是用于捕捉是從各種來源的增量收集的資料是有用的。這包括社交分析,時間序列,保持互動式儀表盤的最新潮流和計數器,以及管理審計日志系統。例子包括Bloomberg 交易終端和開放時間序列資料庫(OpenTSDB)的商店,并提供通路收集伺服器系統的健康名額。
應用程式可以在HBase的頂部使用它作為資料存儲上運作。例子包括Phoenix ,OpenTSDB,KIJI,和Titan。應用程式也可以內建HBase的。例子包括Hive,Pig,Solr,Storm,Flume,Impala,Spark,Ganglia和Drill。
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-get-started/">擷取在HDInsight開始使用HBase的用Hadoop</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-provision-vnet/">提供HDInsight叢集在Azure虛拟網絡</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-analyze-twitter-sentiment/">與HBase的在HDInsight分析Twitter的感悟</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-build-java-maven/">使用Maven建構使用HBase的與HDInsight Java應用程式(Hadoop的)</a>
<a target="_blank" href="https://github.com/hdinsight/hbase-sdk-for-net">C#HBase的SDK</a>
<a target="_blank" href="https://hbase.apache.org/">Apache的HBase</a>
<a target="_blank" href="http://research.google.com/archive/bigtable.html">Bigtable的:分布式存儲系統的結構化資料</a>