XINDOO的博客 ·

Agent设计模式——术语表

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

提示词影响AI模型输出效果，上下文窗口是模型处理信息的最大容量。上下文学习使模型快速适应新任务，零样本、单样本和少样本提示提高响应精度。多模态能力使AI处理多种数据类型，事实锚定确保输出准确。核心架构包括Transformer和RNN，开发流程涵盖预训练、微调和对齐，以符合人类价值观。增强AI Agent能力的技术有思维链、思维树和规划等。

🎯

关键要点

提示词是用户向AI模型提供的输入，影响模型响应效果。
上下文窗口是模型处理信息的最大token容量，超出范围的信息将被忽略。
上下文学习使模型通过嵌入示例快速适应新任务，无需额外训练。
零样本、单样本与少样本提示技术通过提供示例引导模型生成响应。
多模态能力使AI理解并处理跨数据类型的信息，支持更丰富的交互。
事实锚定确保模型输出与可验证真实信息源关联，降低幻觉发生。
Transformer是现代LLM的基石架构，利用自注意力机制处理长文本序列。
循环神经网络（RNN）通过循环结构维持对历史输入的记忆，早于Transformer。
专家混合架构通过动态筛选专家网络处理特定输入，控制计算开销。
扩散模型专注于高质量图像生成，通过逆转随机噪声过程实现新数据生成。
Mamba架构具备超长上下文序列处理能力，是Transformer的潜在替代方案。
LLM开发生命周期包括预训练、微调和对齐，确保模型符合人类价值观。
预训练阶段通过海量数据训练模型，掌握语言规律与世界知识。
微调阶段使用小规模数据集将通用模型适配至特定任务。
对齐技术确保AI模型行为契合人类价值观，输出安全且有帮助。
思维链技术引导模型逐步展示推理过程，提升复杂任务的精确度。
思维树框架支持Agent探索多条推理路径，增强复杂问题解决能力。
ReAct框架将推理与工具使用结合，优化复杂任务的执行过程。
规划能力使Agent将高层目标分解为可管理的子任务，制定执行计划。
深度研究能力使Agent自主深入探索主题，构建全面的主题认知。
评审模型用于审查和评估其他AI模型的输出，确保质量标准。

🔎

延伸解读

提示词的重要性

提示词在AI模型的输出中扮演着关键角色。用户提供的提示词质量直接影响模型的响应效果，因此掌握提示工程技巧对于高效使用AI至关重要。良好的提示词结构能够引导模型更准确地理解用户意图，从而提升交互体验。

上下文窗口的限制

上下文窗口的大小决定了AI模型一次性处理信息的能力。超出窗口范围的信息将被忽略，这意味着在复杂对话中，用户需要注意信息的简洁性和相关性，以确保模型能够有效理解并生成所需的输出。

多模态能力的应用

多模态能力使AI能够处理不同类型的数据，如文本、图像和音频。这种能力不仅增强了AI的交互性，还为用户提供了更丰富的使用场景，例如在图像描述和语音问答中，用户可以期待更自然的交流体验。

对齐技术的必要性

对齐技术确保AI模型的输出符合人类的价值观和期望，避免潜在的误导性信息。通过强化学习等方法，AI能够在训练过程中不断调整其行为，确保输出的安全性和实用性，这对于AI的广泛应用至关重要。

❓

延伸问答

什么是提示词，它对AI模型有什么影响？

提示词是用户向AI模型提供的输入，影响模型的响应效果，提示词的质量与结构深度至关重要。

上下文窗口的作用是什么？

上下文窗口是AI模型单次处理的最大token容量，超出范围的信息将被忽略，影响对话交互与文档分析能力。

什么是多模态能力，它如何提升AI的交互？

多模态能力使AI理解并处理跨数据类型的信息，支持更丰富的类人化交互，如图像描述和语音问答。

LLM的开发生命周期包括哪些阶段？

LLM的开发生命周期包括预训练、微调和对齐三个阶段，确保模型符合人类价值观。

思维链技术如何提升AI的推理能力？

思维链技术引导模型逐步展示推理过程，常在复杂任务中产生更精确的结果。

评审模型的功能是什么？

评审模型用于审查和评估其他AI模型的输出，确保质量标准并优化推理流程。

🏷️