腾讯云公布4月8日大范围故障原因 升级API产生兼容性问题并产生循环依赖
💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
腾讯云4月8日出现大范围故障,影响产品控制台和API操作。故障原因是API版本兼容性和配置数据灰度机制问题。改进措施包括解决循环依赖问题和提供故障逃生通道。状态页面透明度问题也被解决。
🎯
关键要点
- 4月8日腾讯云出现大范围故障,影响产品控制台和API操作。
- 故障原因是API版本兼容性和配置数据灰度机制问题。
- 故障导致用户无法通过Web界面或API执行操作,但服务器本身正常运行。
- 故障的直接原因是云API服务版本向前兼容性考虑不足和配置数据灰度机制不足。
- 新版本接口协议变化导致旧版本数据处理逻辑异常,生成错误配置数据。
- 灰度机制不足导致异常数据快速扩散,造成整体API使用异常。
- 发生循环依赖问题,导致服务无法自动拉起,最终通过手工启动恢复服务。
- 腾讯云制定改进措施,包括解决循环依赖问题和优化服务部署架构。
- 提供API服务逃生通道,以便故障发生后快速切换调用方法。
- 状态页面透明度问题导致用户误认为是自身问题,腾讯云计划解除状态页对API的依赖。
➡️