Keepalived脑裂的解决和预防(附脚本)
💡
原文中文,约4800字,阅读约需12分钟。
📝
内容提要
本文介绍了防止裂脑问题的方法,包括使用多种连接方式、监控报警、增加仲裁机制、启用磁盘锁等。提供了脚本解决裂脑问题。需要根据业务需求确定是否能容忍损失。
🎯
关键要点
- 使用串行电缆和以太网电缆连接,确保心跳消息传送的可靠性。
- 检测到裂脑时强行关闭一个心跳节点,需特殊设备支持。
- 实施监控报警机制,及时介入仲裁以降低损失。
- 根据业务需求确定是否能容忍裂脑造成的损失。
- 在多节点集群中增加仲裁机制,确定资源的归属。
- 启用磁盘锁以防止共享磁盘资源被抢占,但需注意解锁问题。
- 报警机制设计为在服务器接管前留足处理时间。
- 提供脚本解决脑裂问题,需注意防火墙和配置问题。
- 脚本通过周期性ping网关和检查keepalived服务状态来判断网络状态。
- 使用keepalived提供的vrrp_script及track_script实现脚本执行。
➡️