本文研究了移动机器人自主探索和检查的问题,提出了一种新的数据驱动的模仿学习框架,并通过EXPLORE算法训练了一个策略,以模仿一个有完整信息的先知来最大化获取信息的能力。验证了该方法在不同对象分布上的适应能力。
完成下面两步后,将自动完成登录并继续当前操作。