Update Hadoop-MapReduce.md

This commit is contained in:
heibaiying 2019-03-16 12:29:27 +08:00 committed by GitHub
parent 0c0c96d89c
commit dedd966706
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -39,9 +39,7 @@ MapReduce框架专门用于`<keyvalue>`对,也就是说,框架将作业
4. **shuffling**由于Mapping操作可能是在不同的机器上并行处理的所以需要通过shuffling将相同的数据分到同一个节点上去合并这样才能统计出最终的结果此时得到K2为每一个单词List(V2)为可迭代集合V2就是Mapping中的V2
5. **Reducing** : 这里的案例是统计单词出现的总次数所以Reducing迭代List(V2),并计算其和值,最终输出。
MapReduce 编程模型中`splitting`` shuffing`操作都是由框架实现的,实际上,主要需要我们实现的是`mapping``reducing`
中的编程逻辑这也就是为何该框架叫做MapReduce的原因。
MapReduce 编程模型中`splitting`` shuffing`操作都是由框架实现的,实际上,主要需要我们实现的是`mapping``reducing`中的编程逻辑这也就是为何该框架叫做MapReduce的原因。