Claude Code 的上下文压缩:五层级联与免费摘要的艺术
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
Full Compact 通过使用 forked agent 共享主会话的 prompt cache 前缀,继承系统提示和消息历史,仅在末尾添加压缩指令。forked agent 不设置 maxOutputTokens,以避免影响缓存,若失败则回退到普通路径。
🎯
关键要点
-
Full Compact 通过使用 forked agent 共享主会话的 prompt cache 前缀。
-
Fork 继承主会话的 system prompt、tools 和完整的消息历史作为 context。
-
仅在末尾追加一条压缩指令,以便大部分输入命中已有缓存。
-
forked agent 不能设置 maxOutputTokens,以避免影响缓存。
-
如果 forked agent 路径失败,系统会回退到普通的 streaming 路径。
🏷️
标签
➡️