GitHub可用性报告:2025年5月

GitHub可用性报告:2025年5月

💡 原文约500字/词,阅读约需2分钟。
📝

内容提要

2025年5月,GitHub发生三次服务性能下降事件,涉及附件上传失败、工作流延迟和Microsoft Teams集成中断。问题源于新功能、后端缓存配置错误和身份验证问题。团队已采取措施修复并防止类似事件再次发生。

🎯

关键要点

  • 2025年5月,GitHub经历了三次服务性能下降事件。
  • 5月1日,Issues服务出现问题,用户无法上传附件,原因是新功能导致CORS错误。
  • 事件影响了约13万用户,持续约45分钟,团队通过回滚功能标志来缓解问题。
  • 为防止类似事件再次发生,团队将增加监控指标以确保安全发布变更。
  • 5月28日,GitHub Actions在公共仓库中出现工作流延迟,原因是后端缓存配置错误。
  • 约19.7%的Ubuntu-24托管运行器作业受到影响,团队通过更新后端缓存解决了问题。
  • 5月30日,Microsoft Teams GitHub集成服务发生完全服务中断,持续7小时50分钟。
  • 中断是由于下游身份验证提供商的身份验证问题导致的,监控警报阈值不够敏感。
  • 团队与提供商合作解决身份验证失败,并计划迁移到更耐用的身份验证方法。

延伸问答

2025年5月GitHub发生了哪些服务性能下降事件?

2025年5月,GitHub经历了三次服务性能下降事件,分别是Issues服务上传附件失败、GitHub Actions工作流延迟和Microsoft Teams集成服务中断。

5月1日的Issues服务问题是如何解决的?

5月1日的问题通过回滚导致CORS错误的新功能标志来缓解,持续约45分钟。

GitHub Actions在5月28日遇到了什么问题?

5月28日,GitHub Actions在公共仓库中出现工作流延迟,约19.7%的Ubuntu-24托管运行器作业受到影响,原因是后端缓存配置错误。

Microsoft Teams集成服务中断的原因是什么?

Microsoft Teams集成服务中断是由于下游身份验证提供商的身份验证问题导致的,监控警报阈值不够敏感。

GitHub团队为防止未来类似事件采取了哪些措施?

GitHub团队增加了监控指标以确保安全发布变更,并计划迁移到更耐用的身份验证方法。

这些服务性能下降事件对用户的影响有多大?

5月1日的事件影响了约13万用户,5月28日的事件影响了约19.7%的Ubuntu-24托管运行器作业。

➡️

继续阅读