《Hadoop與大資料挖掘》一2.7　本章小結

2021-11-08 13:55:36

本節書摘來華章計算機《hadoop與大資料挖掘》一書中的第2章，第2.7節，張良均　樊　哲　位文超　劉名軍許國傑　周　龍　焦正升　著更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

本章首先介紹了hadoop的基本概念、原理以及hadoop生态系統各個架構。接着，介紹了hadoop的安裝配置以及開發環境ide配置。在此基礎上介紹了hadoop常用的叢集指令、hadoop mapreduce程式設計開發原理，針對mapreduce程式設計開發，詳細介紹了map-reduce原理、單詞計數源碼分析，結合源碼分析了mapreduce原理。在本章的最後兩個小節，分别介紹了資料挖掘中的經典算法：k-means算法、tf-idf算法，并針對其hadoop mapreduce實作進行了詳細分析。同時，本章中包含大量動手實踐章節，這些動手實踐章節要求讀者自行完成（部分有示例代碼參考），通過這些動手實踐環節，可以加深讀者對hadoop、hadoop hdfs、hadoop mapreduce的了解，同時對如何針對經典算法或者單機算法使用hadoop mapreduce模式來實作肯定會有自己的心得體會。

相信通過本章的學習，讀者不僅可以對hadoop、hadoop mapreduce的原理有更深入的了解，而且對開發hadoop mapreduce程式也可以說初窺門徑了。

《Hadoop與大資料挖掘》一2.7　本章小結

繼續閱讀

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

C++ 第十五周報告1--《冒泡法排序》

淺談企業活動中進行資料分析的重要性

ubuntu14.04下安裝hbse1.0.1.1

筆試面試題目：滑動視窗(二)

User Defined Hadoop DataType

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希

《Hadoop與大資料挖掘》一2.7 本章小結

繼續閱讀

《Hadoop與大資料挖掘》一2.7　本章小結