luozhiyun`s Blog 我的技术分享 ·

AI Agent 的上下文系统：Context Engineering 指南

💡 原文中文，约5600字，阅读约需14分钟。

📝

内容提要

上下文工程是优化大型语言模型（LLM）处理有限上下文窗口的策略，旨在管理整个输入上下文，确保模型关注重要信息。有效的上下文工程可以防止信息处理能力下降，避免准确性崩溃和指令漂移。通过压缩、子代理架构和文件系统等方法，提高信息传递效率，确保模型在多轮交互中保持高效和准确。

🎯

🔎

上下文工程在大型语言模型的应用中至关重要。有效的上下文管理可以防止信息处理能力下降，避免准确性崩溃和指令漂移等问题。随着上下文的增加，模型提取信息的能力可能会急剧下降，因此需要采取措施确保模型关注最重要的信息。

上下文工程的最佳实践包括信息压缩、子代理架构和文件系统的使用。通过级联摘要和Token级硬裁剪等方法，可以有效减少传递给模型的Token数量，确保信息的完整性。同时，子代理架构可以将复杂任务分解，避免上下文限制带来的干扰。

在上下文拼接过程中，动态分配Token预算是防止信息过载的有效策略。为不同部分设置权重，可以确保重要信息不被挤出上下文。这种方法有助于保持模型输出的准确性和一致性，尤其是在多轮交互中。

❓

上下文工程是优化大型语言模型处理有限上下文窗口的策略，旨在管理整个输入上下文，确保模型关注重要信息。

上下文腐败可能导致准确性崩溃、指令漂移和逻辑死循环等问题。

最佳实践包括信息压缩、子代理架构和使用文件系统作为上下文补充。

压缩方法包括级联摘要、Token级硬裁剪和语义软压缩，以减少传递给模型的Token数量。

子代理架构通过分工处理特定任务，避免上下文限制，提高信息处理效率。

需要管理整个上下文状态，包括系统指令、工具、外部数据和消息历史记录，以确保模型输出的准确性和高效性。

🏷️