利用认知和机器模型在协作多智能体系统中学习
原文中文,约300字,阅读约需1分钟。发表于: 。基于平衡学习理论和深度强化学习技术,我们提出了三种多智能体实例基学习(MAIBL)模型,用于协调在随机环境下的多智能体系统。通过在动态环境中展示瞬间学习能力和协调技巧,我们证明 MAIBL 模型相对于现有的多智能体深度强化学习模型更快地学习和实现更好的协调。我们还讨论了将认知洞察力整合到多智能体深度强化学习模型中的好处。
本文介绍了一种新的多智能体强化学习方法,结合了合作任务分解和学习奖励机制,以编码子任务的结构。该方法能够处理部分可观察环境中奖励的非马尔可夫性质,并提高了学习策略的可解释性。研究结果表明,该方法在具有大状态空间和多个智能体的复杂环境中具有前景。