宝玉的分享 ·

AI 智能体的上下文工程：实用指南

💡 原文中文，约7800字，阅读约需19分钟。

📝

内容提要

上下文工程是一种新策略，旨在优化输入Token以引导AI模型产生预期行为。与提示词工程不同，它在有限的注意力预算下选择信息，以提升模型表现和效率。有效的上下文管理对长时程任务至关重要，涉及压缩、结构化笔记和子智能体架构等技术。

🎯

🔎

上下文工程是优化AI模型表现的关键策略。与传统的提示词工程不同，它关注如何在有限的注意力预算内选择最有效的信息，以提升模型的效率和准确性。有效的上下文管理能够帮助AI智能体在长时程任务中保持连贯性，避免信息衰减带来的负面影响。

在长时程任务中，AI智能体面临上下文污染的问题。为此，压缩、结构化笔记和子智能体架构等技术被提出。压缩通过总结对话内容来提升连贯性，结构化笔记则允许智能体持久化信息，子智能体架构则通过分离关注点提高任务处理效率。这些技术的结合能够有效应对上下文窗口的限制。

动态检索上下文的策略允许AI智能体在运行时加载必要的信息，而不是预先处理所有数据。这种方法不仅提高了存储效率，还能让智能体在复杂任务中逐步发现相关上下文，增强其自主性和灵活性。通过轻量级标识符，智能体能够更有效地管理信息，提升决策质量。

❓

上下文工程是一整套策略，旨在优化模型推理过程中的Token选择，而提示词工程主要关注如何编写有效的提示词。

上下文衰减是指随着Token数量增加，模型准确回忆信息的能力下降的现象。

有效管理上下文需要找到信号最强但规模最小的Token集合，并保持系统提示词清晰、直接。

可以通过压缩、结构化笔记和子智能体架构等技术来绕过上下文窗口大小的限制。

动态检索上下文是通过轻量级标识符在运行时加载数据，以提高上下文的相关性和效率。

上下文工程的核心原则是深思熟虑地筛选信息，以最大化预期结果的可能性。

🏷️