内容提要
2025年8月,GitHub发生三次服务性能下降,原因是数据库迁移和搜索连接问题导致请求失败。经过修复和监控改进,服务逐步恢复。
关键要点
-
2025年8月,GitHub经历了三次服务性能下降事件。
-
8月5日,因数据库迁移导致请求失败,影响了约4%的网络和REST API流量。
-
修复措施包括指示ORM忽略已删除的列,服务在16:13 UTC恢复。
-
第二次事件影响了约0.1%的拉取请求流量,最终在19:45 UTC解决。
-
8月12日,GitHub搜索服务性能下降,用户体验不准确或不完整的搜索结果。
-
在14:00 UTC到15:30 UTC期间,搜索查询失败率高达75%。
-
问题源于负载均衡器与搜索主机之间的间歇性连接问题,最终在17:14 UTC解决。
-
8月27日,Copilot及REST API流量性能下降,Copilot请求失败率达36%。
-
此事件同样因数据库迁移导致,最终在21:17 UTC恢复。
-
为防止未来类似问题,已实施临时阻止所有删除列操作,并增加了更多保护措施。
延伸问答
2025年8月GitHub发生了哪些服务性能下降事件?
2025年8月,GitHub经历了三次服务性能下降事件,分别发生在8月5日、8月12日和8月27日。
8月5日的服务性能下降是由于什么原因?
8月5日的服务性能下降是由于数据库迁移导致请求失败,影响了约4%的网络和REST API流量。
GitHub在8月12日的搜索服务问题是如何解决的?
8月12日的搜索服务问题通过限制搜索索引管道的负载和稳定重试机制解决,最终在17:14 UTC恢复。
8月27日的Copilot性能下降事件有什么相似之处?
8月27日的Copilot性能下降事件与8月5日相似,都是由于数据库迁移导致ORM继续引用已删除的列,导致大量请求失败。
GitHub采取了哪些措施来防止未来类似问题?
GitHub实施了临时阻止所有删除列操作,并增加了更多保护措施,以防止未来类似问题的发生。
在8月12日的事件中,搜索查询失败率最高达到了多少?
在8月12日的事件中,搜索查询失败率最高达到了75%。