Update Spark简介.md

This commit is contained in:
heibaiying 2019-06-04 10:52:18 +08:00 committed by GitHub
parent 0f26aaa790
commit 97b5cc6886
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -19,17 +19,11 @@ Spark于2009年诞生于加州大学伯克利分校AMPLab。2013年该项目
## 二、特点
+ Apache Spark使用最先进的DAG调度程序查询优化器和物理执行引擎以实现性能上的保证
+ 多语言支持如JavaScalaPythonR语言;
+ Spark提供80多个高级的API可以轻松构建并行应用程序
+ 支持批处理,流处理和复杂的分析;
+ 丰富的类库支持包括SQLDataFramesMLlibGraphX和Spark Streaming等库。并且可以在同一个应用程序中无缝地进行组合
+ 丰富的部署模式支持本地模式和自带的集群模式也支持在HadoopMesosKubernetes上运行
+ 多数据源支持支持访问HDFSAlluxioCassandraHBaseHive以及数百个其他数据源中的数据。
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/future-of-spark.png"/> </div>