该论文提出了一种针对自主导航任务的端到端方法,包括学习应急计划和分层规划器相结合,以应对信念突然改变的情况。研究表明,该方法能够在部分可观察的随机环境中实现健壮性安全行为,并能推广至未见过的环境动态。
完成下面两步后,将自动完成登录并继续当前操作。