1、Apache Hadoop 不足之處
• 版本管理混亂
• 部署過程繁瑣、更新過程複雜
• 相容性差
• 安全性低
2、Hadoop 發行版
• Apache Hadoop
• Cloudera’s Distribution Including Apache Hadoop(CDH)
• Hortonworks Data Platform (HDP)
• MapR
• EMR
• …
3、CDH能解決哪些問題
• 1000台伺服器的叢集,最少要花費多長時間來搭建好Hadoop叢集,包括Hive、Hbase、Flume、Kafka、Spark等等
• 隻給你一天時間,完成以上工作?
• 對于以上叢集進行hadoop版本更新,你會選擇什麼更新方案,最少要花費多長時間?
• 新版本的Hadoop,與Hive、Hbase、Flume、Kafka、Spark等等相容?
4、CDH簡介
• Cloudera's Distribution, including Apache Hadoop
• 是Hadoop衆多分支中的一種,由Cloudera維護,基于穩定版本的Apache Hadoop建構
• 提供了Hadoop的核心
– 可擴充存儲
– 分布式計算
• 基于Web的使用者界面
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsISPrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdsATOfd3bkFGazxCMx8VesATMfhHLlN3XnxCMwEzX0xiRGZkRGZ0Xy9GbvNGLpZTY1EmMZVDUSFTU4VFRR9Fd4VGdsYTMfVmepNHLrJXYtJXZ0F2dvwVZnFWbp1zczV2YvJHctM3cv1Ce-cmbw5CM3EWNwcDO0gjMzYTMzcTNzgTMxgDOwMGZxIzYmFGO58CX4AzLchDMxIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjL1M3Lc9CX6MHc0RHaiojIsJye.png)
5、CDH的優點
• 版本劃厘清晰
• 版本更新速度快
• 支援Kerberos安全認證
• 文檔清晰
• 支援多種安裝方式(Cloudera Manager方式)
6、CDH安裝方式
• Cloudera Manager
• Yum
• Rpm
• Tarball
7、CDH下載下傳位址
• CDH5.4