天天看點

MapReduce中的shuffle過程以及優化是如何實作的

shuffle過程

key

1.shuffle的功能

  • 分區:

    決定目前key是交由哪個reduce進行處理,

    預設:按照key的hash值對reduce的個數進行取餘,HashPartitioner.

  • 分組:

    将相同的key進行合并;

  • 排序:

    按照 key對每一組keyvalue進行排序,預設為字典排序;

2.執行過程

MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的
MapReduce中的shuffle過程以及優化是如何實作的

繼續閱讀