Claude Code 的上下文压缩:五层级联与免费摘要的艺术

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

Full Compact 通过使用 forked agent 共享主会话的 prompt cache 前缀,继承系统提示和消息历史,仅在末尾添加压缩指令。forked agent 不设置 maxOutputTokens,以避免影响缓存,若失败则回退到普通路径。

🎯

关键要点

  • Full Compact 通过使用 forked agent 共享主会话的 prompt cache 前缀。

  • Fork 继承主会话的 system prompt、tools 和完整的消息历史作为 context。

  • 仅在末尾追加一条压缩指令,以便大部分输入命中已有缓存。

  • forked agent 不能设置 maxOutputTokens,以避免影响缓存。

  • 如果 forked agent 路径失败,系统会回退到普通的 streaming 路径。

➡️

继续阅读