一、課程概述
本次教育訓練課程主要面向大資料系統管理人員和開發設計人員,基于開源社群大資料應用最活躍的Hadoop和HBase技術架構。圍繞分布式檔案存儲(HDFS)、分布式并行計算(Map/Recue)和非關系型資料庫(NoSql)三個大資料核心應用展開,旨在幫助教育訓練對象建立起完整的大資料理論基礎架構和實踐操作能力。主要課程内容包括:
1.大資料應用發展史;
2.分布式檔案系統HDFS原理與架構、HDFS系統管理、HDFS開發與設計;
3.分布式并行計算架構Map/Reduce工作原理與架構、Map/Reduce任務運作監控、Map/Reduce任務排程、Map/Redcue開發與設計;
4.非關系型資料庫HBase邏輯架構、HBase實體存儲、HBase關鍵流程和算法、HBase開發與設計;
5.Hadoop操作實踐:叢集部署、檔案管理、資料管理
6.大資料應用案例分析:金融、電信、網際網路、電商平台
二、課程大綱
日程
課程子產品
課程内容
第1天
大資料概述
什麼是大資料?
Hadoop概要
Hadoop生态系統介紹
Hadoop叢集安裝與部署
Hadoop獨立部署
Hadoop僞分布式安裝部署
Hadoop配置參數詳解
Hadoop配置故障診斷
第2天
HDFS系統管理
HDFS體系結構
HDFS讀寫過程-串行寫與并行讀
HDFS 管理接口-HDFS shell && HDFS Web Interface
HDFS 新增節點
HDFS 删除節點
HDFS 版本更新
HDFS 高可用性方案完全解析
第3天
Map/Reduce架構與原理
Map/Reduce體系結構
Map/Reduce管理接口-Map/Reduce shell && Map/Reduce Web Interface
Map/Reduce任務排程政策
Map/Reduce 性能調優
Map/Reduce 類SQL工具Hive介紹
第4天
HBASE架構與原理
HBASE體系結構
HBASE實體存儲
HBASE關鍵流程算法
HBASE管理接口-HBase Shell&& HBase Web Interface
HBASE與RDBMS的比較
Zookeeper介紹
第5天
Hadoop平台操作實踐
Hadoop叢集部署
Hadoop檔案管理
Hadoop資料管理
Hadoop叢集監控
大資料應用案例分析
金融、電信、網際網路、電商
三、服務支援
Hadoop技術交流群:293503507
技術教育訓練邀請:13718542435
本文版權歸作者所有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接配接,否則保留追究法律責任的權利。