优化阅读格式

This commit is contained in:
heibaiying
2019-07-31 17:18:07 +08:00
parent ceb868fe13
commit ca7c99802b
91 changed files with 4059 additions and 4058 deletions

View File

@ -17,11 +17,11 @@
## 一、Zookeeper集群搭建
为保证集群高可用Zookeeper集群的节点数最好是奇数最少有三个节点所以这里搭建一个三个节点的集群。
为保证集群高可用Zookeeper 集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群。
### 1.1 下载 & 解压
下载对应版本Zookeeper这里我下载的版本`3.4.14`。官方下载地址https://archive.apache.org/dist/zookeeper/
下载对应版本 Zookeeper这里我下载的版本 `3.4.14`。官方下载地址https://archive.apache.org/dist/zookeeper/
```shell
# 下载
@ -32,9 +32,9 @@ tar -zxvf zookeeper-3.4.14.tar.gz
### 1.2 修改配置
拷贝三份zookeeper安装包。分别进入安装目录的`conf`目录,拷贝配置样本`zoo_sample.cfg ``zoo.cfg`并进行修改,修改后三份配置文件内容分别如下:
拷贝三份 zookeeper 安装包。分别进入安装目录的 `conf` 目录,拷贝配置样本 `zoo_sample.cfg ``zoo.cfg` 并进行修改,修改后三份配置文件内容分别如下:
zookeeper01配置
zookeeper01 配置:
```shell
tickTime=2000
@ -51,9 +51,9 @@ server.2=127.0.0.1:2288:3388
server.3=127.0.0.1:2289:3389
```
> 如果是多台服务器则集群中每个节点通讯端口和选举端口可相同IP地址修改为每个节点所在主机IP即可。
> 如果是多台服务器则集群中每个节点通讯端口和选举端口可相同IP 地址修改为每个节点所在主机 IP 即可。
zookeeper02配置与zookeeper01相比只有`dataLogDir``dataLogDir`不同:
zookeeper02 配置,与 zookeeper01 相比,只有 `dataLogDir``dataLogDir` 不同:
```shell
tickTime=2000
@ -68,7 +68,7 @@ server.2=127.0.0.1:2288:3388
server.3=127.0.0.1:2289:3389
```
zookeeper03配置与zookeeper0102相比也只有`dataLogDir``dataLogDir`不同:
zookeeper03 配置,与 zookeeper0102 相比,也只有 `dataLogDir``dataLogDir` 不同:
```shell
tickTime=2000
@ -85,18 +85,18 @@ server.3=127.0.0.1:2289:3389
> 配置参数说明:
>
> - **tickTime**用于计算的基础时间单元。比如session超时N*tickTime
> - **initLimit**:用于集群,允许从节点连接并同步到 master节点的初始化连接时间以tickTime的倍数来表示
> - **syncLimit**:用于集群, master主节点与从节点之间发送消息请求和应答时间长度心跳机制
> - **tickTime**:用于计算的基础时间单元。比如 session 超时N*tickTime
> - **initLimit**:用于集群,允许从节点连接并同步到 master 节点的初始化连接时间,以 tickTime 的倍数来表示;
> - **syncLimit**:用于集群, master 主节点与从节点之间发送消息,请求和应答时间长度(心跳机制);
> - **dataDir**:数据存储位置;
> - **dataLogDir**:日志目录;
> - **clientPort**用于客户端连接的端口默认2181
> - **clientPort**:用于客户端连接的端口,默认 2181
### 1.3 标识节点
分别在三个节点的数据存储目录下新建`myid`文件,并写入对应的节点标识。Zookeeper集群通过`myid`文件识别集群节点并通过上文配置的节点通信端口和选举端口来进行节点通信选举出leader节点。
分别在三个节点的数据存储目录下新建 `myid` 文件,并写入对应的节点标识。Zookeeper 集群通过 `myid` 文件识别集群节点,并通过上文配置的节点通信端口和选举端口来进行节点通信,选举出 leader 节点。
创建存储目录:
@ -109,7 +109,7 @@ mkdir -vp /usr/local/zookeeper-cluster/data/02
mkdir -vp /usr/local/zookeeper-cluster/data/03
```
创建并写入节点标识到`myid`文件:
创建并写入节点标识到 `myid` 文件:
```shell
#server1
@ -135,7 +135,7 @@ echo "3" > /usr/local/zookeeper-cluster/data/03/myid
### 1.5 集群验证
使用jps查看进程并且使用`zkServer.sh status`查看集群各个节点状态。如图三个节点进程均启动成功并且两个节点为follower节点一个节点为leader节点。
使用 jps 查看进程,并且使用 `zkServer.sh status` 查看集群各个节点状态。如图三个节点进程均启动成功,并且两个节点为 follower 节点,一个节点为 leader 节点。
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/zookeeper-cluster.png"/> </div>
@ -145,7 +145,7 @@ echo "3" > /usr/local/zookeeper-cluster/data/03/myid
### 2.1 下载解压
Kafka安装包官方下载地址http://kafka.apache.org/downloads ,本用例下载的版本为`2.2.0`,下载命令:
Kafka 安装包官方下载地址http://kafka.apache.org/downloads ,本用例下载的版本为 `2.2.0`,下载命令:
```shell
# 下载
@ -154,11 +154,11 @@ wget https://www-eu.apache.org/dist/kafka/2.2.0/kafka_2.12-2.2.0.tgz
tar -xzf kafka_2.12-2.2.0.tgz
```
>这里j解释一下kafka安装包的命名规则`kafka_2.12-2.2.0.tgz`为例前面的2.12代表Scala的版本号Kafka采用Scala语言进行开发后面的2.2.0则代表Kafka的版本号。
>这里 j 解释一下 kafka 安装包的命名规则:以 `kafka_2.12-2.2.0.tgz` 为例,前面的 2.12 代表 Scala 的版本号Kafka 采用 Scala 语言进行开发),后面的 2.2.0 则代表 Kafka 的版本号。
### 2.2 拷贝配置文件
进入解压目录的` config`目录下 ,拷贝三份配置文件:
进入解压目录的 ` config` 目录下 ,拷贝三份配置文件:
```shell
# cp server.properties server-1.properties
@ -201,11 +201,11 @@ log.dirs=/usr/local/kafka-logs/02
zookeeper.connect=hadoop001:2181,hadoop001:2182,hadoop001:2183
```
这里需要说明的是`log.dirs`指的是数据日志的存储位置,确切的说,就是分区数据的存储位置,而不是程序运行日志的位置。程序运行日志的位置是通过同一目录下的`log4j.properties`进行配置的。
这里需要说明的是 `log.dirs` 指的是数据日志的存储位置,确切的说,就是分区数据的存储位置,而不是程序运行日志的位置。程序运行日志的位置是通过同一目录下的 `log4j.properties` 进行配置的。
### 2.4 启动集群
分别指定不同配置文件启动三个Kafka节点。启动后可以使用jps查看进程此时应该有三个zookeeper进程和三个kafka进程。
分别指定不同配置文件,启动三个 Kafka 节点。启动后可以使用 jps 查看进程,此时应该有三个 zookeeper 进程和三个 kafka 进程。
```shell
bin/kafka-server-start.sh config/server-1.properties
@ -233,7 +233,7 @@ bin/kafka-topics.sh --describe --bootstrap-server hadoop001:9092 --topic my-repl
可以看到分区0的有0,1,2三个副本且三个副本都是可用副本都在ISR(in-sync Replica 同步副本)列表中,其中1为首领副本,此时代表集群已经搭建成功。
可以看到分区 0 的有 0,1,2 三个副本,且三个副本都是可用副本,都在 ISR(in-sync Replica 同步副本) 列表中,其中 1 为首领副本,此时代表集群已经搭建成功。