天天看點

04 Hadoop生态圈以及各組成部分的簡介

04 Hadoop生态圈以及各組成部分的簡介

重點元件:

HDFS:分布式檔案系統

MAPREDUCE:分布式運算程式開發架構

HIVE:基于大資料技術(檔案系統+運算架構)的SQL資料倉庫工具

HBASE:基于Hadoop的分布式海量資料庫

ZOOKEEPER:分布式協調服務基礎元件

Mahout:基于mapreduce/spark/flink等分布式運算架構的機器學習算法庫

Oozie:工作流排程架構