基于障碍地图的物体导航的两阶段深度增强学习
原文中文,约300字,阅读约需1分钟。发表于: 。通过使用 RGB 和深度信息进行预训练以及在两阶段奖励训练下输出导航动作,本研究在视觉物体导航中显著提高了成功率和导航效率。
本论文提出了一种使用transformer递归更新隐式地图的目标导航方法,并通过辅助任务训练模型。该方法在MP3D数据集上优于最先进方法,在HM3D数据集上具有良好的泛化能力。成功在真实机器人上部署,并在真实场景中实现了令人鼓舞的目标导航结果。
通过使用 RGB 和深度信息进行预训练以及在两阶段奖励训练下输出导航动作,本研究在视觉物体导航中显著提高了成功率和导航效率。
本论文提出了一种使用transformer递归更新隐式地图的目标导航方法,并通过辅助任务训练模型。该方法在MP3D数据集上优于最先进方法,在HM3D数据集上具有良好的泛化能力。成功在真实机器人上部署,并在真实场景中实现了令人鼓舞的目标导航结果。