hadoop 多目录输入，map到reduce如何排序

文章由LinuxBoy分享于2019-03-27 04:03:45热评（451）

使用MultipleInputs.addInputPath 对多个路径输入现在假设有三个目录，并使用了三个mapper去处理，经过map处理后，输出的结果会根据key 进行join，如果使用TextPair，会根据第一个字段jion，第二个字段排序然后在作为reduce的输入，进行计算

推荐文章：