强化 Workers KV

💡 原文英文,约2700词,阅读约需10分钟。
📝

内容提要

在过去几个月中,Workers KV遭遇了一系列事件,直接影响了客户。我们分享了我们的工作和采取的措施来改进KV的部署。KV是一个用于存储数据的键值服务,适用于高读取吞吐量要求的数据。我们在内部广泛使用KV,包括Cloudflare Access和Cloudflare Pages。在6月宣布了新架构以解决客户反馈问题,并进行了测试和验证。然而,在增加流量期间发生了一系列事件。

🎯

关键要点

  • Workers KV在过去几个月遭遇了一系列事件,影响了客户。
  • KV是一个用于存储高读取吞吐量数据的键值服务,广泛应用于Cloudflare内部。
  • 2023年6月宣布了KV的新架构,以解决客户反馈的高延迟和一致性问题。
  • 在增加流量期间,KV遇到了未见过的问题,导致一系列事件发生。
  • 事件的根本原因包括可观察性差和局部状态突变导致的全局状态异常。
  • KV由两个独立的Workers脚本组成,分别是Storage Gateway Worker和SuperCache。
  • 2023年7月17日至20日之间,KV经历了多次故障,导致HTTP 500错误。
  • 故障的影响范围包括墨尔本、维也纳和约翰内斯堡等数据中心。
  • Cloudflare计划通过改进可观察性工具、发布基础设施和流程来提高KV的可靠性。
  • 将加强对环境变量变更的安全性、扩展测试覆盖率和改进发布流程。
  • Cloudflare承认KV未能满足客户期望,正在进行修复工作以提高可靠性。
➡️

继续阅读