可持续觅食问题的在线学习时间依赖性
可持续觅食问题是一个多智能体环境试验平台,研究了神经进化和深度递归 Q 网络在线学习的方法。利用长短期记忆学习时间依赖性帮助智能体开发了单个智能体的可持续策略,但未能帮助智能体处理多智能体场景中的社会困境。
原文中文,约300字,阅读约需1分钟。
可持续觅食问题是一个多智能体环境试验平台,研究了神经进化和深度递归 Q 网络在线学习的方法。利用长短期记忆学习时间依赖性帮助智能体开发了单个智能体的可持续策略,但未能帮助智能体处理多智能体场景中的社会困境。