天天看點

Hadoop管理者認證大綱

子產品内容

提綱

狀态

關于 Apache Hadoop

u  為什麼是 Hadoop?

u  Hadoop 的核心部件

u  基礎概念

HDFS

u  HDFS 特性

u  讀,寫檔案

u  NameNode 記憶體的考慮

u  HDFS 安全性簡介

u  使用 Namenode Web 使用者界面

u  使用 Hadoop 檔案 Shell

資料導入 HDFS

u  用 Flume 将資料從外部源導入

u  用 Sqoop 将資料從關系資料庫導入

u  REST 接口

u  輸入資料的最佳實踐

YARN 和 MapReduce

u  什麼是 MapReduce?

u  MapReduce 基本概念

u  YARN 叢集的架構

u  資源配置設定

u  故障恢複

u  使用 YARN Web 使用者界面

u  MapReduce 版本 1

為你的 Hadoop 叢集做計劃

u  通用計劃的考慮

u  選擇正确的硬體

u  對網絡的考慮

u  配置節點

u  為叢集管理做計劃

Hadoop 安裝和初始配置

u  部署的類型

u  安裝 Hadoop

u  具體化 Hadoop 的配置

u  執行 HDFS 的初始配置

u  執行 YARN 和 MapReduce 的初始配置

u Hadoop 日志系統

安裝配置 Hive, Impala 和 Pig

u  Hive

u  Impala

u  Pig

Hadoop 用戶端

u  什麼是 Hadoop 用戶端?

u  安裝配置 Hadoop 用戶端

u  安裝配置 Hue

u  Hue 授權和認證 叢集的

Cloudera 管理器

u  Cloudera 管理器的動機

u  Cloudera 管理器的特性

u  快速版和企業版

u  Cloudera 管理器拓撲

u  安裝 Cloudera 管理器

u  用 Cloudera 管理器安裝 Hadoop

u  用 Cloudera 管理器執行基本的管理任務

叢集的進階配置

u  進階配置參數

u  配置Hadoop 端口

u  顯性地添加或移除主機

u  配置HDFS 的機架認知

u  配置HDFS 高可用性

Hadoop 的安全方案

u  Hadoop 的安全性的重要

u Hadoop 的安全系統的概念

u  Kerberos 是什麼,它如何工作

u  用 Kerberos 來守衛 Hadoop 叢集

管理, 計劃工作任務

u  管理正在運作的工作

u  計劃 Hadoop 工作

u  配置 FairScheduler

u  Impala 的查詢計劃

叢集的維護

u  檢查 HDFS 狀态

u  在不同叢集間拷貝資料

u  添加和挪去叢集的節點

u  重新平衡叢集

u  叢集更新

叢集的監控和故障診斷

u  通用系統監控

u  監控 Hadoop 叢集

u  常見的 Hadoop Clusters 的故障排除

u  常見的錯誤配置

Hadoop管理者認證大綱