Update Spark简介.md
This commit is contained in:
		| @@ -1,16 +1,17 @@ | ||||
| # Spark简介 | ||||
|  | ||||
| <nav> | ||||
| <a href="#一简介">一、简介</a><br/> | ||||
| <a href="#二特点">二、特点</a><br/> | ||||
| <a href="#三集群架构">三、集群架构</a><br/> | ||||
| <a href="#四核心组件">四、核心组件</a><br/> | ||||
|         <a href="#31-Spark--SQL">3.1 Spark  SQL</a><br/> | ||||
|         <a href="#32-Spark-Streaming">3.2 Spark Streaming</a><br/> | ||||
|         <a href="#33-MLlib">3.3 MLlib</a><br/> | ||||
|         <a href="#34-Graphx">3.4 Graphx</a><br/> | ||||
| <a href="#">  </a><br/> | ||||
| </nav> | ||||
|  | ||||
| <nav> | ||||
| <a href="#一简介">一、简介</a><br/> | ||||
| <a href="#二特点">二、特点</a><br/> | ||||
| <a href="#三集群架构">三、集群架构</a><br/> | ||||
| <a href="#四核心组件">四、核心组件</a><br/> | ||||
|         <a href="#31-Spark--SQL">3.1 Spark  SQL</a><br/> | ||||
|         <a href="#32-Spark-Streaming">3.2 Spark Streaming</a><br/> | ||||
|         <a href="#33-MLlib">3.3 MLlib</a><br/> | ||||
|         <a href="#34-Graphx">3.4 Graphx</a><br/> | ||||
| <a href="#">  </a><br/> | ||||
| </nav> | ||||
|  | ||||
| ## 一、简介 | ||||
|  | ||||
| Spark于2009年诞生于加州大学伯克利分校AMPLab。2013年,该项目被捐赠给Apache软件基金会。2014年2月,成为Apache的顶级项目。相对于MapReduce上的批处理计算,Spark可以带来上百倍的性能提升,因此它成为继MapReduce之后,最为广泛使用的计算框架。 | ||||
| @@ -31,7 +32,7 @@ Spark于2009年诞生于加州大学伯克利分校AMPLab。2013年,该项目 | ||||
|  | ||||
| + 多数据源支持:支持访问HDFS,Alluxio,Cassandra,HBase,Hive以及数百个其他数据源中的数据。 | ||||
|  | ||||
|  | ||||
| <div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/future-of-spark.png"/> </div> | ||||
|  | ||||
| ## 三、集群架构 | ||||
|  | ||||
| @@ -56,7 +57,7 @@ Spark于2009年诞生于加州大学伯克利分校AMPLab。2013年,该项目 | ||||
|  | ||||
| Spark基于Spark Core扩展了四个核心组件,分别用于满足不同领域的计算需求。 | ||||
|  | ||||
|  | ||||
| <div align="center"> <img  width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/spark-stack.png"/> </div> | ||||
|  | ||||
| ### 3.1 Spark  SQL | ||||
|  | ||||
| @@ -94,4 +95,4 @@ MLlib是Spark的机器学习库。其设计目标是使得机器学习变得简 | ||||
|  | ||||
| GraphX是Spark中用于图形计算和图形并行计算的新组件。在高层次上,GraphX通过引入一个新的图形抽象来扩展 RDD:一种具有附加到每个顶点和边缘的属性的定向多重图形。为了支持图计算,GraphX提供了一组基本运算符(如: subgraph,joinVertices 和 aggregateMessages)以及优化后的Pregel API。此外,GraphX 还包括越来越多的图形算法和构建器,以简化图形分析任务。 | ||||
|  | ||||
|  | ||||
| ##    | ||||
|   | ||||
		Reference in New Issue
	
	Block a user