宝玉的分享 ·

Claude Code 省 Token 指南：慎用 1M 上下文，不开新会话或者总是开新会话都不对

💡 原文中文，约6000字，阅读约需15分钟。

📝

内容提要

Claude Code 的用户面临配额消耗过快的问题。频繁开启新会话会导致缓存失效，增加成本。建议保持活跃会话，利用提示缓存，减少重复计算。复杂任务应提前规划，简单任务可降低思考模式。合理管理上下文和模型选择，有助于节省 Token 消耗。

🎯

关键要点

Claude Code 用户面临配额消耗过快的问题，频繁开启新会话会导致缓存失效，增加成本。
建议保持活跃会话，利用提示缓存，减少重复计算，复杂任务应提前规划，简单任务可降低思考模式。
合理管理上下文和模型选择，有助于节省 Token 消耗，避免频繁 /clear 操作。
提示缓存机制可以显著降低输入成本，缓存命中率高时，继续聊天比开新会话便宜。
复杂任务一次性完成比多次修改更省 Token，简单任务则应降低思考模式以节省开支。
使用命令行工具和精简 CLAUDE.md 内容可以减少 Token 消耗，合理规划任务和输入质量也能有效控制成本。
在特定条件下，继续当前会话比开新会话更经济，尤其是在任务未变和缓存仍然有效的情况下。

🔎

延伸解读

缓存机制的重要性

Claude Code 的缓存机制是节省 Token 的关键。频繁开启新会话会导致缓存失效，增加成本。保持活跃会话可以利用提示缓存，显著降低输入成本。理解缓存的工作原理，有助于用户更有效地管理上下文，避免不必要的开支。

复杂与简单任务的处理策略

在处理复杂任务时，建议一次性完成，而不是多次修改，这样可以节省更多 Token。对于简单任务，降低思考模式可以有效减少开支。用户应根据任务的复杂性调整策略，以优化 Token 的使用效率。

合理规划上下文使用

使用 1M 上下文时需谨慎，过长的上下文可能导致缓存失效，增加成本。用户应根据实际需求合理设置上下文长度，避免不必要的 Token 消耗。保持上下文的相关性和有效性是控制成本的关键。

任务切换的成本考量

在任务切换时，用户应考虑是否需要开启新会话。若任务未变且缓存仍有效，继续当前会话更为经济。反之，若任务已更换或缓存过期，则应果断开启新会话，以避免高额的 Token 消耗。

❓

延伸问答

如何有效管理Claude Code的Token消耗？

保持活跃会话，利用提示缓存，避免频繁开启新会话，合理规划任务和输入质量。

为什么频繁开启新会话会增加成本？

频繁开启新会话会导致缓存失效，模型需要重新读取所有输入内容，从而增加Token消耗。

什么是提示缓存，它如何帮助节省Token？

提示缓存是存储中间计算结果的机制，可以在后续请求中直接使用，降低重复计算的成本。

在什么情况下应该开新会话？

当任务切换、闲置超过1小时或上下文被不相关内容填满时，应该开新会话。

如何优化Claude Code的输入质量？

避免将大量无关内容直接粘贴到对话中，提供文件路径让Claude自行检索相关信息。

使用1M上下文窗口有什么风险？

1M上下文窗口可能导致缓存失效，增加Token消耗，尤其是在长时间闲置后继续会话时。

🏷️