The New Stack ·

在生产中扩展人工智能代理所需的条件

💡 原文英文，约1600词，阅读约需6分钟。

📝

内容提要

随着推理模型的发布，复杂问题的解决可通过标准API实现。然而，依赖大型语言模型（LLM）作为中间件会导致可扩展性瓶颈，缺乏共享语义层的通用代理架构使得系统难以有效处理多跳推理，最终输出不可靠。构建可扩展产品需关注上下文层、编排层和治理层，以避免“胶水代码”问题。

🎯

🔎

依赖大型语言模型（LLM）作为中间件可能导致可扩展性瓶颈。企业在构建系统时，需警惕这种依赖可能带来的不稳定性，尤其是在多跳推理的场景中，缺乏共享语义层会使得系统输出不可靠。

在构建可扩展产品时，治理架构至关重要。没有治理的领域层，即使是先进的能力也会加速生成未经验证的输出。企业应重视治理层的设计，以确保系统的可靠性和合规性。

GraphRAG是一种强大的检索技术，但不能替代领域知识图（DKG）。前者用于查询时的检索，而后者则管理系统状态。两者结合使用，才能在生产环境中实现有效的多跳推理和上下文管理。

❓

需要构建一个共享语义层的通用代理架构，以有效处理多跳推理，避免生成不可靠的输出。

GraphRAG是一种查询时检索技术，主要用于改善事实基础，而DKG则用于管理系统状态，二者在功能上互补。

应关注上下文层、编排层和治理层，以确保系统的可扩展性和可靠性。

治理层确保输出的准确性和可审计性，防止生成未经验证的输出，提升系统的可靠性。

通过引入子垂直精度和多步骤工作流，治理架构可以显著减少误报率并提高工作效率。

构建自己的语义翻译层可能导致维护复杂性增加，需承担集成和实体解析的持续工程成本。

🏷️