開發者學堂課程【分布式資料庫 HBase 快速入門:Hive 與 HBase 對比】學習筆記,與課程緊密聯系,讓使用者快速學習知識。
課程位址:
https://developer.aliyun.com/learning/course/101/detail/1760Hive 與 HBase 對比
内容介紹
一、與 Hive 的內建
HBase 與 Hive 的對比
1. Hivew
(1)資料倉庫
Hive 的本質其實就相當于将 HDFS 中已經存儲的檔案在 Mysq1 中做了一個雙射關系,以友善使用 HQL 去管理查詢。
(2)用于資料分析、清洗
Hive 适用于離線的資料分析和清洗,延遲較高。
(3)基于HDFS、MapReduce
Hive 存儲的資料依舊在 DataNode 上,編寫的 HQL 語筏終将是轉換為 MapReduce 代碼執行。
2.HBasev
(1)資料庫
是一種面向列存儲的非關系型資料庫。
(2)用于存儲結構化和非結構化的資料
适用于單表非關系型資料的存儲,不适合做關聯查詢,類似 JOIN 等操作。
(3)基于 HDFS
資料持久化存儲的展現形式是 Hfile,存放于 DataNode 中,被 ResionServer 以region 的形式進行管理。
(4)延遲較低,接入線上業務使用
面對大量的企業資料,HBase 可以直線單表大量資料的存儲,同時提供了高效的資料通路速度。