小红花·文摘

本研究提出了NAVINACT框架，解决了强化学习在真实机器人任务中的探索和泛化挑战。通过动态切换运动规划导航和强化学习策略学习，提高了样本效率，并利用模仿数据引导探索。研究表明，NAVINACT在多个任务中表现优越，提高了适应性和效率，并在复杂操作任务中取得成功。