《Hadoop海量資料處理：技術詳解與項目實戰（第2版）》一導讀

2021-11-08 09:26:39

hadoop海量資料處理：技術詳解與項目實戰（第2版）

為什麼要寫這本書

2013年被稱為“大資料元年”，标志着世界正式進入了大資料時代，而就在這一年，我加入了清華大學蘇州汽車研究院大資料進行中心，從事hadoop的開發、運維和資料挖掘等方面的工作。從出現之日起，hadoop就深刻地改變了人們處理資料的方式。作為一款開源軟體，hadoop能讓所有人享受到大資料紅利，讓所有人在大資料時代站在了同一起跑線上。hadoop很好地诠釋了什麼是“大道至簡，衍化至繁”，hadoop來源于非常樸素的思想，但是卻衍生出大量的元件，讓初學者難以上手。

我在學習和工作的過程中，走過很多彎路也做過很多無用功，盡管這是學習新技術的必由之路，但卻浪費了大量的時間。我将自己學習和工作的心得記錄下來，為了幫助更多像我當年一樣的hadoop學習者，我決定寫一本書，一本自己開始hadoop職業生涯的時候也想讀到的書。

第3章　hadoop的基石：hdfs

第4章　yarn：統一資源管理和排程平台

第5章　分而治之的智慧：mapreduce

第6章　sql on hadoop：hive

第7章　sql to hadoop : sqoop

第8章　hbase:hadoopdatabase

第9章　hadoop性能調優和運維

應用篇：商業智能系統項目實戰

第10章　線上圖書銷售商業智能系統

第11章　系統結構設計

第12章　在開發之前

第13章　實作資料導入導出子產品

第14章　實作資料分析工具子產品

第15章　實作業務資料的資料清洗子產品

第16章　實作點選流日志的資料清洗子產品

第17章　實作購書轉化率分析子產品

第18章　實作購書使用者聚類子產品

第19章　實作排程子產品

結束篇：總結和展望

第20章　總結和展望

《Hadoop海量資料處理：技術詳解與項目實戰（第2版）》一導讀

繼續閱讀

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

ubuntu14.04下安裝hbse1.0.1.1

Linxu常用指令技巧彙總

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

User Defined Hadoop DataType

nginx 安裝錯誤資訊解決

neo4j之cypher使用文檔

Ambari介紹和架構原理

【python】【資料處理】畫多元資料分布圖

NOSQL安全攻擊

sqlServer根據經緯查距離

win10本地scala和spark安裝安裝scala安裝spark