天天看點

《Hadoop實戰第2版》——3.6節本章小結

3.6 本章小結

本章主要介紹了mapreduce的計算模型,其中的關鍵内容是一個流程和四個方法。一個流程指的是資料流程,輸入資料到、到、到、到輸出資料。四個方法就是這個資料轉換過程中使用的方法(分别是inputformat、map、reduce、outputformat),以及其對應的轉換過程。除此之外,還介紹了mapreduce程式設計架構的幾個優化方法,以及hadoop流和hadoop pipes,後者是在hadoop中使用腳本檔案及c++編寫mapreduce程式的方法。