BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 -

利用拓扑地图进行多目标导航的深度强化学ä¹

利用拓扑地图,通过强化学习(RL)将基本动作提升为面向对象的宏动作,使简单的深度 Q 网络(DQN)代理能够解决实际上是不可能的环境。

本文介绍了一种新的视觉导航方法,使用图神经网络和卷积/循环神经网络实现原始行为分解,并在Gibson模拟器中验证了其在已知和未知环境中导航的性能优于相关基准线。

Gibson模拟器 卷积神经网络 图神经网络 循环神经网络 视觉导航

相关推荐 去reddit讨论