利用知识图谱基础的人类记忆系统解决部分可观察的马尔可夫决策过程
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究基于认知科学理论建模了一个拥有语义记忆和情景记忆系统的智能体,并通过OpenAI Gym兼容的环境让其学习如何编码、存储和检索记忆,以最大化奖励。研究发现两个智能体合作能够获得比一个智能体单独行动更好的性能。已提供代码和模型。
🎯
关键要点
- 本研究基于认知科学理论建模了一个拥有语义记忆和情景记忆系统的智能体。
- 智能体的性能表现优于仅有一个记忆系统的智能体。
- 通过OpenAI Gym兼容的环境进行学习,智能体学习编码、存储和检索记忆以最大化奖励。
- 环境允许机器与人类合作,两个智能体合作表现更好。
- 已在开源平台提供代码和模型。
➡️