天天看點

CDH 1、CDH簡介

1、Apache Hadoop 不足之處

  • 版本管理混亂

  • 部署過程繁瑣、更新過程複雜

  • 相容性差

  • 安全性低

2、Hadoop 發行版

  • Apache Hadoop

  • Cloudera’s Distribution Including Apache Hadoop(CDH)

  • Hortonworks Data Platform (HDP)

  • MapR

  • EMR

  • …

3、CDH能解決哪些問題

  • 1000台伺服器的叢集,最少要花費多長時間來搭建好Hadoop叢集,包括Hive、Hbase、Flume、Kafka、Spark等等

  • 隻給你一天時間,完成以上工作?

  • 對于以上叢集進行hadoop版本更新,你會選擇什麼更新方案,最少要花費多長時間?

  • 新版本的Hadoop,與Hive、Hbase、Flume、Kafka、Spark等等相容?

4、CDH簡介 

  • Cloudera's Distribution, including Apache Hadoop

  • 是Hadoop衆多分支中的一種,由Cloudera維護,基于穩定版本的Apache Hadoop建構

  • 提供了Hadoop的核心

    – 可擴充存儲

    – 分布式計算

  • 基于Web的使用者界面

CDH 1、CDH簡介

5、CDH的優點  

  • 版本劃厘清晰

  • 版本更新速度快

  • 支援Kerberos安全認證

  • 文檔清晰

  • 支援多種安裝方式(Cloudera Manager方式)

6、CDH安裝方式

  • Cloudera Manager

  • Yum

  • Rpm

  • Tarball

7、CDH下載下傳位址

  • CDH5.4