子產品内容
提綱
狀态
關于 Apache Hadoop
u 為什麼是 Hadoop?
u Hadoop 的核心部件
u 基礎概念
HDFS
u HDFS 特性
u 讀,寫檔案
u NameNode 記憶體的考慮
u HDFS 安全性簡介
u 使用 Namenode Web 使用者界面
u 使用 Hadoop 檔案 Shell
資料導入 HDFS
u 用 Flume 将資料從外部源導入
u 用 Sqoop 将資料從關系資料庫導入
u REST 接口
u 輸入資料的最佳實踐
YARN 和 MapReduce
u 什麼是 MapReduce?
u MapReduce 基本概念
u YARN 叢集的架構
u 資源配置設定
u 故障恢複
u 使用 YARN Web 使用者界面
u MapReduce 版本 1
為你的 Hadoop 叢集做計劃
u 通用計劃的考慮
u 選擇正确的硬體
u 對網絡的考慮
u 配置節點
u 為叢集管理做計劃
Hadoop 安裝和初始配置
u 部署的類型
u 安裝 Hadoop
u 具體化 Hadoop 的配置
u 執行 HDFS 的初始配置
u 執行 YARN 和 MapReduce 的初始配置
u Hadoop 日志系統
安裝配置 Hive, Impala 和 Pig
u Hive
u Impala
u Pig
Hadoop 用戶端
u 什麼是 Hadoop 用戶端?
u 安裝配置 Hadoop 用戶端
u 安裝配置 Hue
u Hue 授權和認證 叢集的
Cloudera 管理器
u Cloudera 管理器的動機
u Cloudera 管理器的特性
u 快速版和企業版
u Cloudera 管理器拓撲
u 安裝 Cloudera 管理器
u 用 Cloudera 管理器安裝 Hadoop
u 用 Cloudera 管理器執行基本的管理任務
叢集的進階配置
u 進階配置參數
u 配置Hadoop 端口
u 顯性地添加或移除主機
u 配置HDFS 的機架認知
u 配置HDFS 高可用性
Hadoop 的安全方案
u Hadoop 的安全性的重要
u Hadoop 的安全系統的概念
u Kerberos 是什麼,它如何工作
u 用 Kerberos 來守衛 Hadoop 叢集
管理, 計劃工作任務
u 管理正在運作的工作
u 計劃 Hadoop 工作
u 配置 FairScheduler
u Impala 的查詢計劃
叢集的維護
u 檢查 HDFS 狀态
u 在不同叢集間拷貝資料
u 添加和挪去叢集的節點
u 重新平衡叢集
u 叢集更新
叢集的監控和故障診斷
u 通用系統監控
u 監控 Hadoop 叢集
u 常見的 Hadoop Clusters 的故障排除
u 常見的錯誤配置
