Cloudflare 2025年11月18日全球网络出现故障事后分析
💡
原文中文,约5900字,阅读约需14分钟。
📝
内容提要
2025年11月18日,Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。经过数小时修复,服务于17:06恢复正常。Cloudflare对此事件表示歉意,并承诺增强系统韧性。
🎯
关键要点
- 2025年11月18日,Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。
- 问题源于数据库系统权限变更,导致特征文件容量翻倍,超出软件设定的限制。
- 初步误判为超大规模DDoS攻击,后确认是特征文件错误导致的故障。
- 故障持续至14:30才被定位并解决,17:06时所有系统恢复正常。
- Cloudflare对此事件表示歉意,并承诺增强系统韧性,防止类似故障重演。
- 故障期间,核心CDN和安全服务返回HTTP 5xx状态码,影响了多个服务。
- Cloudflare的请求处理机制受到影响,导致依赖核心代理的系统出现错误。
- 事件期间,Cloudflare Dashboard和Turnstile服务也受到影响,用户无法登录。
- 修复措施包括强化配置文件处理、启用全局终止开关和审查核心代理模块。
- 此次故障是Cloudflare自2019年以来最严重的停机事件,团队对此深感痛心。
❓
延伸问答
Cloudflare在2025年11月18日发生了什么故障?
Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。
此次故障的主要原因是什么?
故障源于数据库系统权限变更,导致特征文件容量翻倍,超出软件设定的限制。
Cloudflare是如何解决此次故障的?
通过停止错误特征文件的生成与传播,手动插入有效文件,并重启核心代理服务器来解决问题。
故障对用户和服务的影响有哪些?
故障期间,核心CDN和安全服务返回HTTP 5xx状态码,影响了多个服务,用户无法登录Cloudflare Dashboard。
Cloudflare对此事件有什么反应和承诺?
Cloudflare对此事件表示歉意,并承诺增强系统韧性,防止类似故障重演。
此次故障与Cloudflare过去的故障相比如何?
此次故障是Cloudflare自2019年以来最严重的停机事件,团队对此深感痛心。
🏷️
标签
➡️