Tony Bai ·

从 0 到 1.5 亿 QPS：Uber 核心存储架构的十年演进与缓存设计哲学

💡 原文中文，约5900字，阅读约需14分钟。

📝

内容提要

Uber的存储系统经历了十年的演进，从Schemaless到Docstore，再到CacheFront，成功应对PB级数据处理和高并发请求的挑战。Schemaless解决了MySQL的扩展性问题，Docstore结合了NoSQL的灵活性与SQL的强一致性，CacheFront则实现了1.5亿QPS的读取性能，体现了持续演进的重要性。

🎯

关键要点

Uber的存储系统经历了十年的演进，成功应对PB级数据处理和高并发请求的挑战。
Schemaless解决了MySQL的扩展性问题，成为Uber的第一个自研存储系统。
Docstore结合了NoSQL的灵活性与SQL的强一致性，演进为通用的分布式SQL数据库。
CacheFront实现了1.5亿QPS的读取性能，成为深度集成的分布式缓存层。
Schemaless采用无模式设计，简化了数据库管理，但增加了应用层的负担。
Docstore强制执行模式，提升了数据的可靠性和开发效率。
CacheFront通过CDC技术解决了缓存失效问题，提供了更强的一致性。
Uber存储架构的演进为构建大规模后端系统的工程师提供了宝贵的启示。
持续演进的架构能够根据业务需求变化而调整，避免一劳永逸的设计。
生产级缓存系统需要深度集成和强大的可观测性与弹性设计。

❓

延伸问答

Uber的存储系统是如何应对PB级数据处理的？

Uber的存储系统通过Schemaless、Docstore和CacheFront的演进，成功应对PB级数据处理和高并发请求的挑战。

Schemaless的设计目标是什么？

Schemaless的设计目标是构建一个水平可扩展的、对开发者透明的分片层，解决MySQL的扩展性瓶颈。

Docstore与Schemaless相比有哪些改进？

Docstore强制执行模式，提供了强一致性和事务支持，解决了Schemaless的局限性，提升了数据可靠性和开发效率。

CacheFront是如何实现1.5亿QPS的读取性能的？

CacheFront通过深度集成的分布式缓存层，优化读取请求，并利用CDC技术解决缓存失效问题，实现了1.5亿QPS的读取性能。

Uber存储架构演进的主要启示是什么？

Uber存储架构的演进启示是，系统必须能够根据业务需求变化持续演进，且缓存系统需要深度集成与强大的可观测性设计。

CacheFront如何解决缓存与数据库不一致的问题？

CacheFront通过变更数据捕获（CDC）技术，实时追踪数据库变更，并在亚秒级内更新缓存，确保数据一致性。

🏷️

继续阅读

加更：体验 Waymo 无人驾驶汽车
作者在旧金山体验了Waymo无人驾驶汽车，行程完全由车辆自主完成，体验新奇且技术流畅。但Waymo的费用较高，明显高于Uber，适合尝鲜，日常出行仍以Uber为主。
人们在自动驾驶出租车中遗留了很多奇怪的物品
Uber首次在年度失物招领指数中纳入自动驾驶出租车遗留物品，常见物品包括手机、钱包和钥匙，奇特物品如保龄球和玩具也在其中。Uber计划在全球15个城市推广...
让 Amazon Quick 操作飞书：构建远程 MCP 服务的设计实践
本文探讨了如何利用AWS Bedrock AgentCore构建Amazon Quick与飞书的远程MCP服务，提出了按需编排、分层注册和Token安全的...
派早报：Apple 公布 2026 年 Apple 设计大奖得主等
苹果于2026年6月2日公布了Apple设计大奖得主，表彰12款杰出应用和游戏，涵盖六个类别。获奖作品包括grug和Is This Seat Taken?...
运营一个以人工智能为核心的工程组织
工程团队在使用Claude Code后，工作流程显著变化，传统规划被即时规划取代，强调原型和用户反馈。信息收集时优先询问Claude，代码审查中Claud...
以开放为设计理念：NVIDIA与DigitalOcean如何构建始终在线的自主时代技术栈
生成式人工智能的增长不仅依赖于专有模型，开源AI也在重塑开发者生态。NVIDIA与DigitalOcean合作开发开放模型，如NVIDIA Nemotro...