2025年3月21日Cloudflare事件

2025年3月21日Cloudflare事件

💡 原文英文,约2100词,阅读约需8分钟。
📝

内容提要

2025年3月21日,Cloudflare的R2对象存储服务发生了1小时7分钟的故障,导致100%的写操作失败和约35%的读操作失败。故障源于R2网关服务凭证错误部署,影响了生产环境对新凭证的访问。虽然没有数据丢失,但服务可用性受到影响。故障后,Cloudflare采取了防范措施。

🎯

关键要点

  • 2025年3月21日,Cloudflare的R2对象存储服务发生了1小时7分钟的故障。
  • 故障导致100%的写操作失败和约35%的读操作失败,影响了多个Cloudflare服务。
  • 故障源于R2网关服务凭证错误部署,影响了生产环境对新凭证的访问。
  • 故障期间没有数据丢失,但服务可用性受到影响。
  • Cloudflare在识别根本原因后迅速恢复了服务可用性。
  • 故障的发生是由于人为错误,缺乏对凭证使用情况的可见性。
  • Cloudflare采取了多项措施以防止类似故障再次发生,包括添加日志标签和改进凭证轮换流程。
  • 未来将扩展健康检查系统,以确保新凭证的全球传播和状态报告。

延伸问答

Cloudflare的R2对象存储服务在2025年3月21日发生了什么故障?

Cloudflare的R2对象存储服务在2025年3月21日发生了1小时7分钟的故障,导致100%的写操作失败和约35%的读操作失败。

这次故障的主要原因是什么?

故障的主要原因是R2网关服务凭证错误部署,导致生产环境无法访问新凭证。

故障期间是否有数据丢失?

故障期间没有数据丢失,所有成功的上传或变更都得到了保存。

Cloudflare采取了哪些措施来防止类似故障再次发生?

Cloudflare采取了多项措施,包括添加日志标签、改进凭证轮换流程和扩展健康检查系统。

故障对Cloudflare其他服务有什么影响?

故障影响了多个Cloudflare服务,包括Cache Reserve、Images、Log Delivery等,导致相关操作失败或延迟。

Cloudflare如何快速恢复服务可用性?

一旦识别出根本原因,Cloudflare迅速部署了更新的凭证,恢复了服务可用性。

➡️

继续阅读