同步备库硬件故障
处理时序图:
处理过程说明:
序号 | 类型 | 执行方 | 操作过程说明 | 如何验证成功 |
---|---|---|---|---|
1 | 自动 | HAS | 异步备自动切换为同步备。 | HAS状态查看命令,查看集群状态,此时集群状态应为一主一同步备,并且leader为原主库。 |
2 | 人工 | DBA | 线下恢复硬件和OS。 | |
3 | 人工 | DBA | 移除同步备节点DCS,通过DCS集群状态查看命令查看DCS状态,并记录DCS失败节点的ID,通过DCS集群删除节点命令移除失败的DCS 。 配置DCS和故障节点的HAS,参考部署文档。 添加同步备节点DCS,通过DCS集群添加节点命令加入到DCS集群,修改DCS_conf.yml,用添加成功弹出的信息替换原来的配置文件(/usr/local/etc/DCS_conf.yml )中对应的值,检查DCS状态,通过 DCS集群状态查看命令命令确认3个节点DCS状态都健康。 通过HAS启动命令启动同步备节点。 | 通过vsql连接数据库。 执行数据库流复制状态检查命令,可以看到原同步备库的sync_state为Async,原异步备库的sync_state为Sync。 调用HAS状态查看命令,查看集群状态,此时集群状态应为一主一同步备一异步备,并且leader为原主库。 |
4 | 人工 | DBA | 调用HAS停止命令。 | 1.通过vsql连接数据库。 2.执行数据库流复制状态检查命令,将集群当前同步备库关闭时,可以看到原同步备库的sync_state为Sync,启动原异步备库之后,可以看到其sync_state为Async。 3.调用HAS状态查看命令,在集群当前同步备关闭时,查看集群状态,此时集群状态应为一主一同步备,并且同步备库为原同步备库;将集群中原异步备库启动后,查看到的集群状态与最初相同。 |
5 | 自动 | HAS | 异步备自动切换为同步备。 | |
6 | 人工 | DBA | 调用HAS启动命令。 |