diff --git a/notes/Hive.md b/notes/Hive.md index 21fe020..90f1604 100644 --- a/notes/Hive.md +++ b/notes/Hive.md @@ -36,7 +36,7 @@ Hive构建在Hadoop之上的,可以将结构化的数据文件映射成表, ### 2.2 Metastore -hive里的表名、表结构、字段名、字段类型、表的分隔符等信息就叫做元数据。Metastore是用来存储Hive的元数据,默认元数据是存储在derby关系型数据库中,但是derby是能同时只有一个实例,也就是说不能多个命令行接口同时使用,所以可以替换mysql等。 +hive里的表名、表结构、字段名、字段类型、表的分隔符等信息就叫做元数据。Metastore是用来存储Hive的元数据,默认元数据是存储在derby关系型数据库中,但使用derby时只能有一个实例,也就是说不能多个命令行接口同时使用,通常使用MySQL代替derby。 这里还需要说明的是hive进行的是同一的元数据管理,就是说你在hive上创建了一张表,然后在presto/impala/sparksql 中都是可以直接使用的,同样的你在presto/impala/sparksql中创建一张表,在hive中也是可以使用的。 diff --git a/notes/Storm核心概念详解.md b/notes/Storm核心概念详解.md index 051d583..e54179a 100644 --- a/notes/Storm核心概念详解.md +++ b/notes/Storm核心概念详解.md @@ -10,7 +10,7 @@ 二、Storm架构详解
    2.1 nimbus进程
    2.2 supervisor进程
-    2.3 Zookeeper的作用
+    2.3 zookeeper的作用
    2.4 worker进程
    2.5 executor线程
    2.6 并行度
@@ -207,7 +207,7 @@ Storm 中一共有8个内置的 Stream Grouping。也可以通过实现 `CustomS -### 2.3 Zookeeper的作用 +### 2.3 zookeeper的作用 Nimbus和Supervisor进程都被设计为**快速失败**(遇到任何意外情况时进程自毁)和**无状态**(所有状态保存在Zookeeper或磁盘上)。 因此,如果Nimbus或Supervisor守护进程死亡,它们会重新启动,并从zookeeper上获取之前的状态数据,就像什么都没发生一样。