shuffle過程
key
1.shuffle的功能
-
分區:
決定目前key是交由哪個reduce進行處理,
預設:按照key的hash值對reduce的個數進行取餘,HashPartitioner.
-
分組:
将相同的key進行合并;
-
排序:
按照 key對每一組keyvalue進行排序,預設為字典排序;
key
分區:
決定目前key是交由哪個reduce進行處理,
預設:按照key的hash值對reduce的個數進行取餘,HashPartitioner.
分組:
将相同的key進行合并;
排序:
按照 key對每一組keyvalue進行排序,預設為字典排序;