Update Hadoop-MapReduce.md

This commit is contained in:
heibaiying 2019-03-14 14:07:50 +08:00 committed by GitHub
parent cf17652c35
commit b647004213
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -1,15 +1,16 @@
# 分布式计算框架——MapReduce # 分布式计算框架——MapReduce
<nav>
<a href="#一MapReduce-概述">一、MapReduce 概述</a><br/> <nav>
<a href="#二MapReduce-编程模型简述">二、MapReduce 编程模型简述</a><br/> <a href="#一MapReduce-概述">一、MapReduce 概述</a><br/>
<a href="#三MapReduce-编程模型详述">三、MapReduce 编程模型详述</a><br/> <a href="#二MapReduce-编程模型简述">二、MapReduce 编程模型简述</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#31-InputFormat-&-RecordReaders">3.1 InputFormat & RecordReaders </a><br/> <a href="#三MapReduce-编程模型详述">三、MapReduce 编程模型详述</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#32-combiner">3.2 combiner</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#31-InputFormat-&-RecordReaders">3.1 InputFormat & RecordReaders </a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#33-partitioner">3.3 partitioner</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#32-combiner">3.2 combiner</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#34-sort-&-combiner">3.4 sort & combiner</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#33-partitioner">3.3 partitioner</a><br/>
<a href="#四MapReduce-词频统计案例">四、MapReduce 词频统计案例</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#34-sort-&-combiner">3.4 sort & combiner</a><br/>
</nav> <a href="#四MapReduce-词频统计案例">四、MapReduce 词频统计案例</a><br/>
</nav>
## 一、MapReduce 概述 ## 一、MapReduce 概述
Hadoop MapReduce是一个分布式计算框架用于编写应用程序以可靠容错的方式在大型集群上并行处理大量数据多为TB级别数据集 Hadoop MapReduce是一个分布式计算框架用于编写应用程序以可靠容错的方式在大型集群上并行处理大量数据多为TB级别数据集
@ -80,7 +81,7 @@ combiner是map运算后的可选操作其实际上是一个本地化的reduce
但并非所有场景都适合使用combiner使用它的原则是combiner的输入不会影响到reduce计算的最终输入例如如果计算只是求总数最大值最小值可以使用combiner但是做平均值计算使用combiner的话最终的reduce计算结果就会出错。 但并非所有场景都适合使用combiner使用它的原则是combiner的输入不会影响到reduce计算的最终输入例如如果计算只是求总数最大值最小值可以使用combiner但是做平均值计算使用combiner的话最终的reduce计算结果就会出错。
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/mapreduce-combiner.png"/> </div> <div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/mapreduce-combiner.png"/> </div>
### 3.3 partitioner ### 3.3 partitioner