💡
原文英文,约1400词,阅读约需5分钟。
📝
内容提要
上下文工程是构建动态系统以支持大型语言模型(LLM)完成任务的学科,侧重于系统设计和模型生成响应时的所有信息,优化短期“工作记忆”,提升LLM在多种输入下的一致性和能力。
🎯
关键要点
- 上下文工程是构建动态系统以支持大型语言模型(LLM)完成任务的学科。
- 上下文工程关注模型生成响应时所需的所有信息,而不仅仅是单一的提示字符串。
- 上下文包括系统消息、用户查询、对话历史、长期记忆、外部数据和工具输出等多个组件。
- 上下文工程强调设计系统,而不仅仅是编写提示,涉及优化短期“工作记忆”。
- 上下文工程与提示工程的主要区别在于范围,前者关注模型的整体知识和信息管理。
- 提示工程通常是一次性的,而上下文工程则强调系统化、可重复的框架。
- 检索增强生成(RAG)结合搜索步骤与LLM,确保模型能够使用最新的事实。
- 上下文工程依赖于RAG来确保响应的准确性,但也需要决定哪些信息是相关的。
- 上下文工程将LLM从简单的聊天机器人转变为强大的自主代理。
- 通过精心策划系统指令、记忆和检索知识,开发者为代理提供必要的情境意识。
➡️