💡
原文英文,约900词,阅读约需4分钟。
📝
内容提要
2026年3月,GitHub发生四次服务性能下降事件,影响多个功能。问题源于用户设置的缓存机制写入负载,导致请求失败率高达93%。GitHub已采取措施改进监控和缓存机制,以提升服务稳定性。
🎯
关键要点
- 2026年3月,GitHub发生四次服务性能下降事件,影响多个功能。
- 3月3日,GitHub经历了可用性下降,导致请求失败率高达40%。
- 问题源于用户设置的缓存机制写入负载,导致请求失败率高达93%。
- GitHub已采取措施改进监控和缓存机制,以提升服务稳定性。
- 3月5日,GitHub Actions的工作流运行失败率高达95%,因Redis基础设施更新导致配置错误。
- 3月19日和20日,Copilot Coding Agent服务出现故障,导致请求失败率高达100%。
- 故障原因是系统认证问题,已通过轮换受影响的凭证进行修复。
- 3月24日,Microsoft Teams集成服务出现故障,导致GitHub事件通知无法送达,错误率达到90.1%。
- GitHub正在更新可观察性和操作手册,以减少未来问题的解决时间。
❓
延伸问答
2026年3月GitHub发生了多少次服务性能下降事件?
2026年3月,GitHub发生了四次服务性能下降事件。
GitHub在3月3日的可用性下降事件中,请求失败率达到了多少?
在3月3日的事件中,请求失败率达到了40%。
导致GitHub Actions在3月5日出现高失败率的原因是什么?
高失败率是由于Redis基础设施更新导致的配置错误。
GitHub如何应对3月19日和20日的Copilot Coding Agent服务故障?
GitHub通过轮换受影响的凭证来修复系统认证问题,恢复了服务连接。
GitHub在3月24日的Microsoft Teams集成服务故障中,错误率达到了多少?
在3月24日的故障中,错误率达到了90.1%。
GitHub为提高服务稳定性采取了哪些措施?
GitHub已改进监控和缓存机制,并添加了killswitch以提升服务稳定性。
➡️