一、HDFS概述
1.HDFS産出背景及定義
2.HDFS優缺點
3.HDFS組成架構
4.HDFS檔案塊大小(面試重點)
二、HDFS的Shell操作(開發重點)
1.基本文法
2.指令大全
3.常用指令實操
三、HDFS用戶端操作(開發重點)
1.HDFS用戶端環境準備
2.HDFS的API操作
——HDFS檔案上傳(測試參數優先級)
——HDFS檔案下載下傳
——HDFS檔案夾删除
——HDFS檔案名更改
——HDFS檔案詳情檢視
——HDFS檔案和檔案夾判斷
3.HDFS的I/O流操作
——HDFS檔案上傳
——HDFS檔案下載下傳
——定位檔案讀取
四、HDFS的資料流(面試重點)
1.HDFS寫資料流程
——剖析檔案寫入
——網絡拓撲-節點距離計算
——機架感覺(副本存儲節點選擇)
2.HDFS讀資料流程
五、NameNode和SecondaryNameNode(面試開發重點)
1.NN和2NN工作機制
2. Fsimage和Edits解析
3.CheckPoint時間設定
4.NameNode故障處理
方式一:
方式二:
5.叢集安全模式
6.NameNode多目錄配置
六、DataNode(面試開發重點)
1.DataNode工作機制
2.資料完整性
3.掉線時限參數設定
4.服役新資料節點
5.退役舊資料節點
——添加白名單
——黑名單退役
6.Datanode多目錄配置
七、HDFS 2.X新特性
1.叢集間資料拷貝
2.小檔案存檔
3.資源回收筒
4.快照管理