HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。它是仿照谷歌的BigTable是一个列面向家庭的数据库。数据被存储在一排内的表和数据的行是由列族分组。 HBase的是在这个意义上,无论是列也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。它可以依靠数据冗余,批处理和通过在Hadoop的生态系统的分布式应用程序提供的其他功能。
HDInsight HBase的是提供一个管理的集群集成到Azure的环境。集群被配置为直接在Azure的Blob存储,这提供了在性能/成本的选择低延迟和增加的弹性存储数据。这使客户能够建立一个大型数据集工作的互动式网站,构建存储传感器和遥测数据,从数以百万计的端点的服务,并分析这些数据与Hadoop作业。 HBase的和Hadoop的都是很好的出发点,在Azure的大数据项目,特别是,可以实现实时应用与大型数据集工作。
BigTable的,并推而广之,HBase的创建为其典型使用案例就是网络搜索。搜索引擎建立一个映射条款,包含它们的网页索引。但也有许多其他的用例HBase的适合哪几个的,都逐项列出在本节。
HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的使用HBase的为自己的邮件系统,它是理想的存储和管理互联网通信。 WebTable使用HBase的搜索和管理从网页中提取表。
HASE是用于捕捉是从各种来源的增量收集的数据是有用的。这包括社交分析,时间序列,保持交互式仪表盘的最新潮流和计数器,以及管理审计日志系统。例子包括Bloomberg 交易终端和开放时间序列数据库(OpenTSDB)的商店,并提供访问收集服务器系统的健康指标。
应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括Phoenix ,OpenTSDB,KIJI,和Titan。应用程序也可以集成HBase的。例子包括Hive,Pig,Solr,Storm,Flume,Impala,Spark,Ganglia和Drill。
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-get-started/">获取在HDInsight开始使用HBase的用Hadoop</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-provision-vnet/">提供HDInsight集群在Azure虚拟网络</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-analyze-twitter-sentiment/">与HBase的在HDInsight分析Twitter的感悟</a>
<a target="_blank" href="http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-build-java-maven/">使用Maven构建使用HBase的与HDInsight Java应用程序(Hadoop的)</a>
<a target="_blank" href="https://github.com/hdinsight/hbase-sdk-for-net">C#HBase的SDK</a>
<a target="_blank" href="https://hbase.apache.org/">Apache的HBase</a>
<a target="_blank" href="http://research.google.com/archive/bigtable.html">Bigtable的:分布式存储系统的结构化数据</a>