170 lines
5.6 KiB
Markdown
170 lines
5.6 KiB
Markdown
# Storm集群环境搭建
|
||
|
||
<nav>
|
||
<a href="#一集群规划">一、集群规划</a><br/>
|
||
<a href="#二前置条件">二、前置条件</a><br/>
|
||
<a href="#三集群搭建">三、集群搭建</a><br/>
|
||
<a href="#1-下载并解压">1. 下载并解压</a><br/>
|
||
<a href="#2-配置环境变量">2. 配置环境变量</a><br/>
|
||
<a href="#3-集群配置">3. 集群配置</a><br/>
|
||
<a href="#4-安装包分发">4. 安装包分发</a><br/>
|
||
<a href="#四-启动集群">四. 启动集群</a><br/>
|
||
<a href="#41-启动ZooKeeper集群">4.1 启动ZooKeeper集群</a><br/>
|
||
<a href="#42-启动Storm集群">4.2 启动Storm集群</a><br/>
|
||
<a href="#43-查看集群">4.3 查看集群</a><br/>
|
||
<a href="#五高可用验证">五、高可用验证</a><br/>
|
||
</nav>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
## 一、集群规划
|
||
|
||
这里搭建一个3节点的Storm集群:三台主机上均部署`Supervisor`和`LogViewer`服务。同时为了保证高可用,除了在hadoop001上部署主`Nimbus`服务外,还在hadoop002上部署备用的`Nimbus`服务。`Nimbus`服务由Zookeeper集群进行协调管理,如果主`Nimbus`不可用,则备用`Nimbus`会成为新的主`Nimbus`。
|
||
|
||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/storm-集群规划.png"/> </div>
|
||
|
||
## 二、前置条件
|
||
|
||
Storm 运行依赖于Java 7+ 和 Python 2.6.6 +,所以需要预先安装这两个软件。同时为了保证高可用,这里我们不采用Storm内置的Zookeeper,而采用外置的Zookeeper集群。由于这三个软件在多个框架中都有依赖,其安装步骤单独整理至 :
|
||
|
||
- [Linux环境下JDK安装](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Linux下JDK安装.md)
|
||
- [Linux环境下Python安装](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Linux下Python安装.md)
|
||
|
||
+ [Zookeeper单机环境和集群环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Zookeeper单机环境和集群环境搭建.md)
|
||
|
||
|
||
|
||
## 三、集群搭建
|
||
|
||
### 1. 下载并解压
|
||
|
||
下载安装包,之后进行解压。官方下载地址:http://storm.apache.org/downloads.html
|
||
|
||
```shell
|
||
# 解压
|
||
tar -zxvf apache-storm-1.2.2.tar.gz
|
||
|
||
```
|
||
|
||
### 2. 配置环境变量
|
||
|
||
```shell
|
||
# vim /etc/profile
|
||
```
|
||
|
||
添加环境变量:
|
||
|
||
```shell
|
||
export STORM_HOME=/usr/app/apache-storm-1.2.2
|
||
export PATH=$STORM_HOME/bin:$PATH
|
||
```
|
||
|
||
使得配置的环境变量生效:
|
||
|
||
```shell
|
||
# source /etc/profile
|
||
```
|
||
|
||
### 3. 集群配置
|
||
|
||
修改`${STORM_HOME}/conf/storm.yaml`文件,配置如下:
|
||
|
||
```yaml
|
||
# Zookeeper集群的主机列表
|
||
storm.zookeeper.servers:
|
||
- "hadoop001"
|
||
- "hadoop002"
|
||
- "hadoop003"
|
||
|
||
# Nimbus的节点列表
|
||
nimbus.seeds: ["hadoop001","hadoop002"]
|
||
|
||
# Nimbus和Supervisor需要使用本地磁盘上来存储少量状态(如jar包,配置文件等)
|
||
storm.local.dir: "/home/storm"
|
||
|
||
# workers进程的端口,每个worker进程会使用一个端口来接收消息
|
||
supervisor.slots.ports:
|
||
- 6700
|
||
- 6701
|
||
- 6702
|
||
- 6703
|
||
```
|
||
|
||
`supervisor.slots.ports`参数用来配置workers进程接收消息的端口,默认每个supervisor节点上会启动4个worker,当然你也可以按照自己的需要和服务器性能进行设置,假设只想启动2个worker的话,此处配置2个端口即可。
|
||
|
||
### 4. 安装包分发
|
||
|
||
将Storm的安装包分发到其他服务器,分发后建议在这两台服务器上也配置一下Storm的环境变量。
|
||
|
||
```shell
|
||
scp -r /usr/app/apache-storm-1.2.2/ root@hadoop002:/usr/app/
|
||
scp -r /usr/app/apache-storm-1.2.2/ root@hadoop003:/usr/app/
|
||
```
|
||
|
||
|
||
|
||
## 四. 启动集群
|
||
|
||
### 4.1 启动ZooKeeper集群
|
||
|
||
分别到三台服务器上启动ZooKeeper服务:
|
||
|
||
```shell
|
||
zkServer.sh start
|
||
```
|
||
|
||
### 4.2 启动Storm集群
|
||
|
||
因为要启动多个进程,所以统一采用后台进程的方式启动。进入到`${STORM_HOME}/bin`目录下,执行下面的命令:
|
||
|
||
**hadoop001 & hadoop002 :**
|
||
|
||
```shell
|
||
# 启动主节点 nimbus
|
||
nohup sh storm nimbus &
|
||
# 启动从节点 supervisor
|
||
nohup sh storm supervisor &
|
||
# 启动UI界面 ui
|
||
nohup sh storm ui &
|
||
# 启动日志查看服务 logviewer
|
||
nohup sh storm logviewer &
|
||
```
|
||
|
||
**hadoop003 : **
|
||
|
||
hadoop003上只需要启动`supervisor`服务和`logviewer`服务:
|
||
|
||
```shell
|
||
# 启动从节点 supervisor
|
||
nohup sh storm supervisor &
|
||
# 启动日志查看服务 logviewer
|
||
nohup sh storm logviewer &
|
||
```
|
||
|
||
|
||
|
||
### 4.3 查看集群
|
||
|
||
使用`jps`查看进程,三台服务器的进程应该分别如下:
|
||
|
||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/storm-集群-shell.png"/> </div>
|
||
|
||
|
||
|
||
<br/>
|
||
|
||
访问hadoop001或hadoop002的`8080`端口,界面如下。可以看到有一主一备2个`Nimbus`和3个`Supervisor`,并且每个`Supervisor`有四个`slots`,即四个可用的`worker`进程,此时代表集群已经搭建成功。
|
||
|
||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/storm-集群搭建1.png"/> </div>
|
||
|
||
|
||
|
||
## 五、高可用验证
|
||
|
||
这里手动模拟主`Nimbus`异常的情况,在hadoop001上使用`kill`命令杀死`Nimbus`的线程,此时可以看到hadoop001上的`Nimbus`已经处于`offline`状态,而hadoop002上的`Nimbus`则成为新的`Leader`。
|
||
|
||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/storm集群搭建2.png"/> </div> |