Update Azkaban简介.md

This commit is contained in:
heibaiying 2019-04-11 23:53:38 +08:00 committed by GitHub
parent dee46046fb
commit 5d2b02bbd8
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -3,9 +3,7 @@
## 一、Azkaban 介绍
### 1.1 背景
一言以蔽之Azkaban 是大数据场景下的工作流调度系统。
#### 1.1 背景
一个完整的大数据分析系统,必然有很多任务单元组成(如数据收集、数据清洗、数据存储、数据分析等)。 所有的任务单元及其之间的依赖关系组成了多个工作流。复杂的工作流管理涉及到很多问题:
@ -78,4 +76,4 @@ Oozie使用Tomcat等Web服务器作为Web页面展示容器默认使用derby
+ 页面设计Azkaban的界面比较简单易用所有任务的执行结果、执行日志、任务之间的依赖关系都可以从界面上直观查看
+ 配置方面在Flow 1.0 版本的工作流定义是基于Properties文件的这个时候的限制可能会多一点但是在Flow 2.0 中支持YARM语法来进行配置熟悉Spring开发的朋友可能都知道Spring Boot就采用的YAML代替之前繁重的XMLYAML语法使得Azkaban Flow 的配置更为简单、灵活。