本研究提出了NAVINACT框架,解决了强化学习在真实机器人任务中的探索和泛化挑战。通过动态切换运动规划导航和强化学习策略学习,提高了样本效率,并利用模仿数据引导探索。研究表明,NAVINACT在多个任务中表现优越,提高了适应性和效率,并在复杂操作任务中取得成功。
完成下面两步后,将自动完成登录并继续当前操作。