Claude Code中的延迟工具加载

💡 原文英文,约1800词,阅读约需7分钟。
📝

内容提要

Claude Code引入了延迟加载工具机制,以优化API请求效率。工具分为始终加载和延迟加载两类,仅在需要时加载完整架构,节省令牌成本。核心工具ToolSearch支持精确选择和关键词搜索,确保用户在会话中使用必要工具,提高系统灵活性和资源利用率。

🎯

关键要点

  • Claude Code引入延迟加载工具机制,以优化API请求效率。
  • 工具分为始终加载和延迟加载两类,始终加载的工具包括Bash、Read、Edit等。
  • 延迟加载的工具仅在需要时加载,节省令牌成本。
  • 核心工具ToolSearch支持精确选择和关键词搜索,帮助用户在会话中使用必要工具。
  • 延迟加载机制通过API级别协调,确保模型只知道工具的名称而不需要完整架构。
  • 系统通过消息历史跟踪已发现的工具,确保在会话中保持可用性。
  • 延迟加载的行为由环境变量ENABLE_TOOL_SEARCH控制,支持三种模式:始终延迟、自动和从不延迟。
  • 在会话压缩后,系统通过边界标记和增量通知机制恢复已发现的工具。
  • MCP工具默认延迟加载,但可以通过设置特殊标记来例外处理。
  • 延迟加载机制类似于动态链接,旨在节省令牌而非内存。

延伸问答

Claude Code的延迟加载工具机制有什么好处?

延迟加载工具机制可以优化API请求效率,节省令牌成本,避免不必要的工具加载。

Claude Code中有哪些工具是始终加载的?

始终加载的工具包括Bash、Read、Edit、Write、Glob、Grep Agent和ToolSearch等。

ToolSearch工具的主要功能是什么?

ToolSearch工具支持精确选择和关键词搜索,帮助用户在会话中查找所需的延迟加载工具。

延迟加载的工具是如何被发现和使用的?

延迟加载的工具通过ToolSearch被发现,模型在需要时调用ToolSearch来获取工具的完整架构。

Claude Code的延迟加载机制是如何控制的?

延迟加载行为由环境变量ENABLE_TOOL_SEARCH控制,支持三种模式:始终延迟、自动和从不延迟。

在会话中如何保持已发现工具的可用性?

系统通过消息历史跟踪已发现的工具,确保在会话中保持可用性。

➡️

继续阅读