diff --git a/notes/Hadoop-MapReduce.md b/notes/Hadoop-MapReduce.md index ff869f7..86f94d6 100644 --- a/notes/Hadoop-MapReduce.md +++ b/notes/Hadoop-MapReduce.md @@ -1,15 +1,16 @@ # 分布式计算框架——MapReduce - - + + + ## 一、MapReduce 概述 Hadoop MapReduce是一个分布式计算框架,用于编写应用程序,以可靠,容错的方式在大型集群上并行处理大量数据(多为TB级别数据集)。 @@ -80,7 +81,7 @@ combiner是map运算后的可选操作,其实际上是一个本地化的reduce 但并非所有场景都适合使用combiner,使用它的原则是combiner的输入不会影响到reduce计算的最终输入,例如:如果计算只是求总数,最大值,最小值可以使用combiner,但是做平均值计算使用combiner的话,最终的reduce计算结果就会出错。 -