Finisky Garden ·

子Agent省90%费用的Prompt Cache共享机制

💡 原文中文，约12500字，阅读约需30分钟。

📝

内容提要

Claude Code的fork子agent通过共享缓存机制优化并行任务成本，确保99%以上的字节一致性，显著降低输入费用。使用Anthropic API的Prompt Cache机制，缓存命中可享受90%折扣，减少并行调用成本。设计强调字节级一致性，确保多个请求共享相同前缀，避免不必要费用。

🎯

关键要点

Claude Code的fork子agent通过共享缓存机制优化并行任务成本，确保99%以上的字节一致性。
使用Anthropic API的Prompt Cache机制，缓存命中可享受90%折扣，减少并行调用成本。
设计强调字节级一致性，确保多个请求共享相同前缀，避免不必要费用。
fork子agent继承父agent的完整对话上下文，确保缓存共享。
命名子agent通过削减上下文来降低成本，不追求与父agent共享缓存。
fork子agent的工具池中保留了Agent工具，以保持工具定义的字节一致性。
并行fork的设计确保每个子agent在执行时获得完全隔离的上下文，避免相互干扰。
缓存共享机制通过将差异推到消息序列的末尾，最大化公共前缀的长度。

❓

延伸问答

Claude Code的fork子agent如何优化并行任务成本？

Claude Code的fork子agent通过共享缓存机制，确保99%以上的字节一致性，从而显著降低输入费用。

Prompt Cache机制的折扣是如何实现的？

使用Anthropic API的Prompt Cache机制，缓存命中可享受90%的折扣，前提是多个请求之间的前缀字节完全一致。

fork子agent与命名子agent的主要区别是什么？

fork子agent继承父agent的完整对话上下文并共享缓存，而命名子agent则有独立的system prompt和工具集，不共享缓存。

如何确保fork子agent之间的字节级一致性？

通过在API请求构造时精心设计，确保所有并行子agent之间99%以上的字节完全相同，从而实现字节级一致性。

fork子agent的工具池中保留Agent工具的目的是什么？

保留Agent工具是为了保持工具定义的字节一致性，确保缓存共享的有效性。

并行fork的设计如何避免子agent之间的相互干扰？

每个fork子agent在执行时获得完全隔离的上下文，确保它们之间不会相互干扰。

🏷️

继续阅读

模型评估：证明您的路由策略确实有效
本文介绍了DigitalOcean的模型评估功能，帮助团队在真实工作负载下评估不同的推理策略。用户可以通过比较多种模型和路由策略来优化成本、延迟和输出质量...
基于 Amazon ECS Fargate 和 Graviton 构建企业级多租户 AI Agent 平台：OpenClaw + Hermes 双 Agent 实践
本文介绍了基于Amazon ECS Fargate和Graviton构建的企业级多租户AI Agent平台，结合OpenClaw和Hermes两个开源Ag...
存之有序，治之有矩——Agent 记忆系统的工程实践与演进
本文探讨了Agent记忆系统的工程实践与演进，分析了记忆写入纪律、Prompt Cache冲突、跨模型容量、Embedding迁移及Agent自产Skil...
教你薅token（二）：构建agent无关的skills管理工作流
本文介绍了pks（个人技能管理器），一个用纯bash编写的工具，旨在管理AI工作流文档。pks允许用户集中管理特定项目的技能，如编码规范和API设计，并按...
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...
史上最强游戏掌机来了！性能堪比 PS5，但……
今年掌机市场因元器件成本上涨而涨价，但英特尔等公司推出的新芯片提升了掌机性能和能效。微星和宏碁的新款掌机搭载英特尔 Arc G3 处理器，表现出色，续航能...