💡
原文中文,约7400字,阅读约需18分钟。
📝
内容提要
代理是自主感知环境并采取行动的智能体,利用大语言模型提升智能程度。决策流程包括感知、规划和行动,记忆分为感觉、短期和长期记忆。计划和响应基于记忆和反思,可以递归生成更细粒度的动作。对话基于记忆生成。
🎯
关键要点
-
代理是自主感知环境并采取行动的智能体,利用大语言模型提升智能程度。
-
代理的决策流程包括感知、规划和行动,形成闭环学习过程。
-
记忆分为感觉记忆、短期记忆和长期记忆,分别对应不同的信息处理阶段。
-
反思是代理生成的更高级别思考,帮助代理进行更深层次的决策。
-
计划是代理为实现目标而制定的长期策略,能够递归生成更细粒度的动作。
-
代理在执行过程中会根据环境变化更新计划,并进行对话互动。
-
LangChain中的Agent和Chain的区别在于Agent使用LLM进行动态决策,而Chain是硬编码的动作序列。
-
记忆流记录代理的所有经历,帮助代理在决策时检索相关信息。
-
代理的记忆检索包括近期性、重要性和相关性三个评分标准。
-
反思和计划都被储存在记忆流中,增强代理的决策能力。
➡️