暗无天日 ·

读：从API调用到Agent循环——构建 Agent 的七个阶段

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

本文介绍了构建Agent的七个阶段，包括API调用和完整的Agent循环。每个阶段强调设计决策的重要性，如系统提示词规范、对话历史管理、工具调用分工、可替换性、测试性以及置信度阈值设置。理解Agent框架的核心逻辑和工程细节是成功实现AI应用的关键。

🎯

🔎

在构建Agent时，系统提示词的设计至关重要。它不仅是与模型交互的契约，还确保模型输出符合预期格式。通过明确的提示词和输出验证，可以有效避免模型输出不符合要求的情况，从而提高系统的稳定性和可靠性。

置信度阈值的设置是生产级AI应用中的关键决策。过高的阈值可能导致过多的人工干预，降低自动化效率；而过低的阈值则可能导致错误未被及时发现，损害用户信任。因此，合理调整阈值以适应具体业务场景是非常重要的。

理解LLM的无状态特性是设计对话系统的基础。用户可以完全控制对话历史，灵活管理上下文信息。这种设计使得开发者能够根据需要截断或修改对话内容，从而提升用户体验和系统的适应性。

❓

构建Agent的七个阶段包括API调用、输出可解析、记住对话、工具调用、可替换可测试、人在回路中和通用化循环。

系统提示词确保模型输出正确格式，类似于传统软件开发中的接口定义，是与模型交互的契约。

对话历史由用户管理，每次调用时将完整的消息历史重新发送给模型，以便模型理解上下文。

置信度阈值决定了模型输出的可靠性，设定过高会导致人工确认过多，设定过低则可能导致错误被忽视。

Agent框架的核心逻辑是一个while循环、工具注册表和消息历史管理，周边的工程化细节更为重要。

工具调用使得LLM成为决策者，模型决定调用什么工具和参数，代码负责执行并返回结果。

🏷️