💡
原文英文,约2100词,阅读约需8分钟。
📝
内容提要
2025年3月21日,Cloudflare的R2对象存储服务发生了1小时7分钟的故障,导致100%的写操作失败和约35%的读操作失败。故障源于R2网关服务凭证错误部署,影响了生产环境对新凭证的访问。虽然没有数据丢失,但服务可用性受到影响。故障后,Cloudflare采取了防范措施。
🎯
关键要点
- 2025年3月21日,Cloudflare的R2对象存储服务发生了1小时7分钟的故障。
- 故障导致100%的写操作失败和约35%的读操作失败,影响了多个Cloudflare服务。
- 故障源于R2网关服务凭证错误部署,影响了生产环境对新凭证的访问。
- 故障期间没有数据丢失,但服务可用性受到影响。
- Cloudflare在识别根本原因后迅速恢复了服务可用性。
- 故障的发生是由于人为错误,缺乏对凭证使用情况的可见性。
- Cloudflare采取了多项措施以防止类似故障再次发生,包括添加日志标签和改进凭证轮换流程。
- 未来将扩展健康检查系统,以确保新凭证的全球传播和状态报告。
❓
延伸问答
Cloudflare的R2对象存储服务在2025年3月21日发生了什么故障?
Cloudflare的R2对象存储服务在2025年3月21日发生了1小时7分钟的故障,导致100%的写操作失败和约35%的读操作失败。
这次故障的主要原因是什么?
故障的主要原因是R2网关服务凭证错误部署,导致生产环境无法访问新凭证。
故障期间是否有数据丢失?
故障期间没有数据丢失,所有成功的上传或变更都得到了保存。
Cloudflare采取了哪些措施来防止类似故障再次发生?
Cloudflare采取了多项措施,包括添加日志标签、改进凭证轮换流程和扩展健康检查系统。
故障对Cloudflare其他服务有什么影响?
故障影响了多个Cloudflare服务,包括Cache Reserve、Images、Log Delivery等,导致相关操作失败或延迟。
Cloudflare如何快速恢复服务可用性?
一旦识别出根本原因,Cloudflare迅速部署了更新的凭证,恢复了服务可用性。
🏷️
标签
➡️