diff --git a/notes/Spark累加器与广播变量.md b/notes/Spark累加器与广播变量.md index e07094b..8336076 100644 --- a/notes/Spark累加器与广播变量.md +++ b/notes/Spark累加器与广播变量.md @@ -1,15 +1,16 @@ # Spark 累加器与广播变量 - - + + + ## 一、简介 -在Spark中,提供了两种类型的共享变量:累加器(accumulator)与广播变量(broadcast variable)。 +在Spark中,提供了两种类型的共享变量:累加器(accumulator)与广播变量(broadcast variable): + 累加器:用来对信息进行聚合,主要用于累计计数等场景; + 广播变量:主要用于在节点间高效分发大对象。