宝玉的分享 ·

上下文工程 | Chris Loy

💡 原文中文，约6400字，阅读约需16分钟。

📝

内容提要

上下文工程是一种提升大语言模型（LLM）决策能力的新方法。通过动态和结构化的信息输入，LLM能够更有效地理解和生成回答。与传统的提示词工程不同，该方法更注重上下文管理和设计模式的应用，使LLM更像分析师而非神谕。

🎯

🔎

上下文工程通过动态和结构化的信息输入，显著提升了大语言模型（LLM）的决策能力。这种方法不仅使模型能够更好地理解复杂问题，还能根据实时数据生成更准确的回答，适应性更强。与传统的提示词工程相比，上下文工程更注重信息的组织和管理，能够有效减少模型的错误率。

上下文窗口是LLM处理信息的关键，但其容量有限，可能导致信息过载或重要信息的遗漏。随着上下文的“大膨胀”，模型在生成回答时的复杂性和出错风险也随之增加。因此，在使用上下文工程时，需谨慎管理输入信息的相关性和简洁性，以确保模型的有效性。

上下文工程的演进促使多智能体系统的发展，每个智能体专注于特定任务，提升整体效率。这种分工合作的模式不仅能优化资源利用，还能通过智能体间的信息交互，增强系统的灵活性和响应能力。未来，如何有效管理智能体之间的上下文交接，将是实现更高效决策的关键。

❓

上下文工程是一种提升大语言模型（LLM）决策能力的新方法，主要目的是通过动态和结构化的信息输入，使LLM更有效地理解和生成回答。

上下文窗口是LLM能处理的词元数量的上限，影响其推理能力，决定了模型在生成回答时能考虑的信息量。

上下文学习允许LLM根据新的结构生成输出，而不仅仅依赖于训练数据，强调了动态信息输入的灵活性，而传统提示词工程则依赖于固定的提示词。

上下文工程通过提供更丰富和结构化的信息，使LLM能够更准确地获取实时数据和外部知识，从而提升其决策能力。

RAG（检索增强生成）是一种有效的上下文工程技术，用于在推理时注入外部知识，帮助LLM生成更准确的回答。

上下文工程促进了多智能体系统的演进，使不同AI智能体能够专注于特定任务，通过工程化管理上下文来提升整体效率。

🏷️