本文讨论了长连接黑洞问题,即数据库crash重启后业务长时间不能恢复的问题,并提出了解决方法。建议业务方设置合适的SocketTimeout参数,数据库团队在高可用切换时断开所有老连接,同时在操作系统层面设置合适的参数。还提到了TCP_USER_TIMEOUT参数和连接池的配置建议。总结了解决该问题的最佳实践。
美团数据库团队建设故障演练平台,验证防守组件三个核心能力,业务方也会积极配合。未来规划包括五个方面。
完成下面两步后,将自动完成登录并继续当前操作。