Cloudflare 2025年11月18日全球网络出现故障事后分析

💡 原文中文,约5900字,阅读约需14分钟。
📝

内容提要

2025年11月18日,Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。经过数小时修复,服务于17:06恢复正常。Cloudflare对此事件表示歉意,并承诺增强系统韧性。

🎯

关键要点

  • 2025年11月18日,Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。
  • 问题源于数据库系统权限变更,导致特征文件容量翻倍,超出软件设定的限制。
  • 初步误判为超大规模DDoS攻击,后确认是特征文件错误导致的故障。
  • 故障持续至14:30才被定位并解决,17:06时所有系统恢复正常。
  • Cloudflare对此事件表示歉意,并承诺增强系统韧性,防止类似故障重演。
  • 故障期间,核心CDN和安全服务返回HTTP 5xx状态码,影响了多个服务。
  • Cloudflare的请求处理机制受到影响,导致依赖核心代理的系统出现错误。
  • 事件期间,Cloudflare Dashboard和Turnstile服务也受到影响,用户无法登录。
  • 修复措施包括强化配置文件处理、启用全局终止开关和审查核心代理模块。
  • 此次故障是Cloudflare自2019年以来最严重的停机事件,团队对此深感痛心。

延伸问答

Cloudflare在2025年11月18日发生了什么故障?

Cloudflare因数据库权限变更导致系统崩溃,用户访问网站时出现错误页面。

此次故障的主要原因是什么?

故障源于数据库系统权限变更,导致特征文件容量翻倍,超出软件设定的限制。

Cloudflare是如何解决此次故障的?

通过停止错误特征文件的生成与传播,手动插入有效文件,并重启核心代理服务器来解决问题。

故障对用户和服务的影响有哪些?

故障期间,核心CDN和安全服务返回HTTP 5xx状态码,影响了多个服务,用户无法登录Cloudflare Dashboard。

Cloudflare对此事件有什么反应和承诺?

Cloudflare对此事件表示歉意,并承诺增强系统韧性,防止类似故障重演。

此次故障与Cloudflare过去的故障相比如何?

此次故障是Cloudflare自2019年以来最严重的停机事件,团队对此深感痛心。

➡️

继续阅读