可持续觅食问题的在线学习时间依赖性

可持续觅食问题是一个多智能体环境试验平台,探索智能体处理社会困境中的认知形式,需要通过觅食抵制个体奖励的诱惑并选择集体的长期可持续目标。我们研究了神经进化和深度递归 Q...

可持续觅食问题是一个多智能体环境试验平台,研究了神经进化和深度递归 Q 网络在线学习的方法。利用长短期记忆学习时间依赖性帮助智能体开发了单个智能体的可持续策略,但未能帮助智能体处理多智能体场景中的社会困境。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文