稳定性方法论:可灰度 & 可监控 & 可回滚
业务系统核心目标是挣钱,系统稳定性建设核心是防止丢钱(丢钱逻辑如下图所示),站在公司的角度看,产品功能建设和系统稳定性是同等重要。前段时间写了《》,该文章在稳定性建设的理论和实践基础上,抽象出稳定性治理的框架,希望建立一个稳定性治理的标准动作、最佳实践。但从读者的反馈上看,有过类似经验的同学深同感触,经验不足的同学没啥感觉,导致这个结果的原因,我反思了一下,认为:概念太粗,落地容易变形。于是,想写一篇文章,把稳定性最重要的东西写出来,于是有了这篇文章。
业务系统核心目标是挣钱,系统稳定性建设核心是防止丢钱。稳定性治理的框架包括可灰度、AB、链路和沙箱灰度。监控是重要的,包括机器、链路、网络和业务监控。可回滚是兜底,需要评估应用、数据库DDL和数据回滚的可行性。