189 lines
9.2 KiB
Markdown
189 lines
9.2 KiB
Markdown
# MongoDB Replication
|
||
|
||
<nav>
|
||
<a href="#一副本集">一、副本集</a><br/>
|
||
<a href="#11-复制功能">1.1 复制功能</a><br/>
|
||
<a href="#12-仲裁者">1.2 仲裁者</a><br/>
|
||
<a href="#二故障发现与恢复">二、故障发现与恢复</a><br/>
|
||
<a href="#21-故障发现">2.1 故障发现</a><br/>
|
||
<a href="#22-优先选举">2.2 优先选举</a><br/>
|
||
<a href="#23-投票成员">2.3 投票成员</a><br/>
|
||
<a href="#三搭建副本集">三、搭建副本集</a><br/>
|
||
<a href="#31-下载并解压">3.1 下载并解压</a><br/>
|
||
<a href="#32-配置环境变量">3.2 配置环境变量</a><br/>
|
||
<a href="#33-修改配置">3.3 修改配置</a><br/>
|
||
<a href="#34-启动服务">3.4 启动服务</a><br/>
|
||
<a href="#35-配置副本集">3.5 配置副本集</a><br/>
|
||
<a href="#36-查看副本集情况">3.6 查看副本集情况</a><br/>
|
||
</nav>
|
||
|
||
|
||
## 一、副本集
|
||
|
||
### 1.1 复制功能
|
||
|
||
为保证数据安全,实现高可用,MongoDB 提供了复制功能,可以将主节点上的数据复制到多个从节点上,这样即便主节点出现异常,由于数据是以多副本的方式进行存储,仍然可以保证数据安全。一个标准的三节点副本集架构如下:
|
||
|
||
<div align="center"> <img src="../pictures/mongodb-复制.png"/> </div>
|
||
|
||
复制过程如下:
|
||
|
||
#### 1. 初始同步
|
||
|
||
在副本集初始化时,主节点的 mongod 进程会扫描当前节点上每个数据库中的每个集合,然后将这些数据发送给从节点,进行初始化的全量复制。
|
||
|
||
#### 2. 同步复制
|
||
|
||
从节点在初始化完成后,不断同步地复制主节点的 oplog 数据。oplog (操作日志) 是一个特殊的集合,它存储了数据库中所有数据的操作记录。oplog 中的每个操作都具有幂等性,即每个操作对目标数据集无论是应用一次还是多次,都会产生相同的结果。
|
||
|
||
#### 3. 异步执行
|
||
|
||
MongoDB 按 namespace 或 document id 对每批操作进行分组,并使用不同的线程应用每组操作,同时 MongoDB 会严格按照原始写入顺序将写入操作应用于从节点上的文档。
|
||
|
||
### 1.2 仲裁者
|
||
|
||
除了可以将正常的 mongod 实例添加到副本集外, 还可以将额外的 mongod 实例添加到副本集作为仲裁者。仲裁者不承担数据的读写操作,它只用于响应选举请求并参与仲裁。因为它不存储数据,所以可以占用更少的服务器资源,如果你的副本集具有偶数个成员,可以通过添加仲裁者来保证有效选举。
|
||
|
||
虽然仲裁者可以占用更少的服务器资源,但是由于其并不存储数据,所以对数据的安全性并不能起到帮助作用。因此应该尽量避免使用仲裁者,同时尽量保证最多只使用一个仲裁者,即如果节点数量恰好是偶数,则添加一个仲裁者,如果节点数量是奇数,那就不需要仲裁者。
|
||
|
||
<div align="center"> <img src="../pictures/mongodb-仲裁者.png"/> </div>
|
||
|
||
## 二、故障发现与恢复
|
||
|
||
### 2.1 故障发现
|
||
|
||
副本集的每个节点之间会维持着两秒一次的心跳检测,当从节点与主节点的通信时间超过配置的 electionTimeoutMillis 时间 (默认为10秒) 时,则认为该主节点出现故障,此时副本集会进行新的主节点选举。
|
||
|
||
### 2.2 优先选举
|
||
|
||
MongoDB 的选举算法会尝试让高优先级的节点优先发起选举,从而更容易在选举中胜出。如果某一个优先级较低的节点在短时间内被选举为新的主节点,这时副本集仍然会继续发起选举,直至可用的最高优先级的节点成为新的主节点。需要特别注意的是在这个过程当中,优先级为 0 的成员不能寻求选举,也不能成为主节点。
|
||
|
||
<div align="center"> <img src="../pictures/mongodb-故障恢复.png"/> </div>
|
||
|
||
### 2.3 投票成员
|
||
|
||
节点发起选举后,需要具有投票权的节点进行投票,当获得半数以上选票时,该备用节点可以成为新的主节点。对于一个复制集,只有处于以下状态的节点拥有投票权,这些节点统称为投票成员:
|
||
|
||
- **PRIMARY**:副本集的主节点。
|
||
- **SECONDARY**:处于复制状态的从节点。
|
||
- **STARTUP2**:mongod 完成配置加载后,副本集的每个成员都进入 STARTUP2 状态,此时它成为副本集的活动成员并且有资格投票。然后该成员决定是否进行初始同步。如果成员开始初始同步,则成员将保留在 STARTUP2 状态,直到所有数据复制完成并构建好索引。之后成员过渡到 RECOVERING。
|
||
- **RECOVERING**:当副本集的成员尚未准备好接受读取操作时,它将进入 RECOVERING 状态。处于恢复状态的成员有资格在选举中投票,但没有资格成为主节点。
|
||
- **ARBITER**:ARBITER 状态的成员不复制数据或接受写入操作,仲裁者通常处于这一状态。
|
||
- **ROLLBACK**:如果成员正在进行数据回滚,它就处于 ROLLBACK 状态。
|
||
|
||
除了投票成员外,那些持有副本集数据的副本,并且可以接受来自客户端应用程序的读取操作,但没有投票权的成员统称为非投票成员。出于网络通讯成本的考虑,MongoDB 的副本集最多有 50 个节点(成员),默认情况下最多可包含 7 个投票成员。投票成员和非投票成员的要求如下:
|
||
|
||
+ 非投票成员的优先级 `members[n].priority` 必须为 0,优先级为 0 的成员不能寻求选举,也不能成为主节点。
|
||
+ 优先级大于 0 的节点持有的票数 `members[n].votes` 不能为 0,该参数默认值为 1,可选值为 1 或 0。
|
||
|
||
如下示例是一个 9 个成员的副本集,包含 7 个投票成员和 2 个无投票成员:
|
||
|
||
<div align="center"> <img src="../pictures/mongdb-vote.png"/> </div>
|
||
|
||
## 三、搭建副本集
|
||
|
||
这里以搭建一个三节点的副本集为例,使用三台服务器,主机名分别为 hadoop001,hadoop002,hadoop003。
|
||
|
||
### 3.1 下载并解压
|
||
|
||
选择所需版本的 MongoDB 进行下载,下载地址为: https://www.mongodb.com/download-center/community
|
||
|
||
<div align="center"> <img src="../pictures/mongodb-version-select.png"/> </div>
|
||
|
||
这里我下载的版本为 `4.0.10` , 安装环境为 `RHEL 7.0`,下载后进行解压:
|
||
|
||
```shell
|
||
tar -zxvf mongodb-linux-x86_64-rhel70-4.0.10.tgz -C /usr/app
|
||
```
|
||
|
||
### 3.2 配置环境变量
|
||
|
||
配置环境变量:
|
||
|
||
```shell
|
||
vi /etc/profile
|
||
```
|
||
|
||
```shell
|
||
export MONGODB_HOME=/usr/app/mongodb-linux-x86_64-rhel70-4.0.10/
|
||
export PATH=${MONGODB_HOME}/bin:$PATH
|
||
```
|
||
|
||
使得配置的环境变量立即生效:
|
||
|
||
```shell
|
||
source /etc/profile
|
||
```
|
||
|
||
### 3.3 修改配置
|
||
|
||
MongoDB 默认存放数据的目录为 `/var/lib/mongo` ,默认存放日志的目录为 `/var/log/mongodb`,采用 TGZ 安装包进行安装时,程序不会自动创建这两个目录,需要预先手动创建。同时由于 `/var/` 下只能存放临时文件,所以这里我们使用其他目录进行存储,命令如下:
|
||
|
||
```shell
|
||
mkdir -p /home/mongodb/data
|
||
mkdir -p /home/mongodb/log
|
||
```
|
||
|
||
修改配置,采用 TGZ 安装包进行安装时,程序不会自动创建配置文件,需要手动创建:
|
||
|
||
```
|
||
vim /etc/mongod.conf
|
||
```
|
||
|
||
在配置文件中增加如下配置,这里的配置采用的是 YAML 的格式:
|
||
|
||
```shell
|
||
processManagement:
|
||
# 以后台进程的方式启动
|
||
fork: true
|
||
systemLog:
|
||
destination: file
|
||
path: "/home/mongodb/log/mongod.log"
|
||
logAppend: true
|
||
storage:
|
||
dbPath: "/home/mongodb/data"
|
||
net:
|
||
port: 27017
|
||
# 如果不修改绑定IP,默认只能在本机访问数据库服务
|
||
bindIp: 0.0.0.0
|
||
replication:
|
||
# 处于同一副本集的所有节点需要保证副本集名称一致
|
||
replSetName: rs0
|
||
```
|
||
|
||
> MongoDB 的所有配置项可以参考其官方文档:[Configuration File Options](https://docs.mongodb.com/manual/reference/configuration-options/)
|
||
|
||
### 3.4 启动服务
|
||
|
||
以上配置步骤在三台主机上均相同。之后启动三台主机上的 mongod 服务,命令如下:
|
||
|
||
```shell
|
||
mongod -f /etc/mongod.conf
|
||
```
|
||
|
||
### 3.5 配置副本集
|
||
|
||
在任意一台主机上使用 mongo shell 连接到本地服务,之后直接使用以下命令配置副本集:
|
||
|
||
```shell
|
||
rs.initiate( {
|
||
_id : "rs0",
|
||
members: [
|
||
{ _id: 0, host: "hadoop001:27017" },
|
||
{ _id: 1, host: "hadoop002:27017" },
|
||
{ _id: 2, host: "hadoop003:27017" }
|
||
]
|
||
})
|
||
```
|
||
|
||
### 3.6 查看副本集情况
|
||
|
||
使用 `rs.status()` 命令查看副本集状态,部分输出如下。从输出中可以看到 hadoop001 为 PRIMARY 节点,而 hadoop002 和 hadoop003 均为 SECONDARY 节点,此时代表副本集已经搭建成功。
|
||
|
||
<div align="center"> <img src="../pictures/mongodb-副本集状态.png"/> </div>
|
||
|
||
## 参考资料
|
||
|
||
- 官方文档:https://docs.mongodb.com/manual/replication/
|
||
- 官方配置说明:https://docs.mongodb.com/manual/reference/configuration-options/
|