Finisky Garden ·

Claude Code的分叉子代理如何共享Prompt缓存

💡 原文英文，约3600词，阅读约需14分钟。

📝

内容提要

Claude Code通过并行生成多个子代理来处理复杂任务，利用Prompt Cache机制显著降低输入成本。子代理共享相同的上下文，确保字节一致性超过99%，实现高达90%的费用折扣。设计强调字节级一致性，避免微小差异导致缓存失效，有效支持并行任务，优化API调用成本。

🎯

❓

Claude Code通过并行生成多个子代理，并利用Prompt Cache机制，使得相同的上下文共享，从而显著降低输入成本，最高可达90%的费用折扣。

Prompt Cache机制允许在请求之间共享相同的前缀字节，从而在字节完全相同的情况下，缓存的部分以10%的正常价格计费。

分叉子代理共享缓存前缀，而命名子代理则独立缓存，无法与父代理共享缓存。

通过构建字节一致的前缀，确保所有子代理的消息序列在大部分内容上完全相同，从而避免微小差异导致缓存失效。

每个分叉子代理在执行时拥有完全隔离的上下文，避免相互干扰，确保每个代理的操作独立进行。

分叉子代理适用于需要完整上下文的并行任务，例如同时修改多个相关文件，以确保正确的编辑决策。

🏷️

自主代理面临的最大挑战：数据库。
大型语言模型正在从简单的聊天机器人发展为能够推理和行动的自主代理，但数据库优化的复杂性仍是主要挑战。卡内基梅隆大学的安迪·帕夫洛指出，AI在数据库领域的影...
GitHub宇宙回来了：在代理时代，我们齐心协力
在2026年Microsoft Build大会上，GitHub推出了新工具和更新，旨在提升用户体验。用户可以在VS Code或CLI中开始工作，然后在手机...
h5i Radio – 利用 Git，让 Claude 和 Codex 进行实时对话
h5i 是一个开源工具，支持多个 AI Agent（如 Claude 和 Codex）通过 Git 协作。其 Agent Radio 功能利用 Git 仓...
代理时代对数据科学的意义
人工智能与数据科学的交汇点正在变化，AI系统能够自主执行多步骤任务，改变了数据科学家的工作。数据科学家需要结合统计思维、编程能力和领域专业知识，同时设计和...
Endava如何围绕AI代理重新设计软件交付
Endava是一家全球技术服务公司，专注于利用AI解决复杂商业问题。公司重新设计工作流程，推动AI在软件交付和日常运营中的应用，提升效率。AI不仅被开发团...
犹他州将Gemini教育工具引入全州K-12学校
谷歌与犹他州教育委员会合作，从2026-2027学年起，为全州K-12学校提供免费的Gemini教育AI工具和培训，惠及超过70.8万名学生和教师。该工具...