Claude Code中的延迟工具加载
💡
原文英文,约1800词,阅读约需7分钟。
📝
内容提要
Claude Code引入了延迟加载工具机制,以优化API请求效率。工具分为始终加载和延迟加载两类,仅在需要时加载完整架构,节省令牌成本。核心工具ToolSearch支持精确选择和关键词搜索,确保用户在会话中使用必要工具,提高系统灵活性和资源利用率。
🎯
关键要点
- Claude Code引入延迟加载工具机制,以优化API请求效率。
- 工具分为始终加载和延迟加载两类,始终加载的工具包括Bash、Read、Edit等。
- 延迟加载的工具仅在需要时加载,节省令牌成本。
- 核心工具ToolSearch支持精确选择和关键词搜索,帮助用户在会话中使用必要工具。
- 延迟加载机制通过API级别协调,确保模型只知道工具的名称而不需要完整架构。
- 系统通过消息历史跟踪已发现的工具,确保在会话中保持可用性。
- 延迟加载的行为由环境变量ENABLE_TOOL_SEARCH控制,支持三种模式:始终延迟、自动和从不延迟。
- 在会话压缩后,系统通过边界标记和增量通知机制恢复已发现的工具。
- MCP工具默认延迟加载,但可以通过设置特殊标记来例外处理。
- 延迟加载机制类似于动态链接,旨在节省令牌而非内存。
❓
延伸问答
Claude Code的延迟加载工具机制有什么好处?
延迟加载工具机制可以优化API请求效率,节省令牌成本,避免不必要的工具加载。
Claude Code中有哪些工具是始终加载的?
始终加载的工具包括Bash、Read、Edit、Write、Glob、Grep Agent和ToolSearch等。
ToolSearch工具的主要功能是什么?
ToolSearch工具支持精确选择和关键词搜索,帮助用户在会话中查找所需的延迟加载工具。
延迟加载的工具是如何被发现和使用的?
延迟加载的工具通过ToolSearch被发现,模型在需要时调用ToolSearch来获取工具的完整架构。
Claude Code的延迟加载机制是如何控制的?
延迟加载行为由环境变量ENABLE_TOOL_SEARCH控制,支持三种模式:始终延迟、自动和从不延迟。
在会话中如何保持已发现工具的可用性?
系统通过消息历史跟踪已发现的工具,确保在会话中保持可用性。
➡️