本研究提出了一种教师与学生联合训练框架,解决了在特权模仿学习中学生因部分可观测性而无法有效模仿教师的问题。实验结果表明,该方法在复杂的四旋翼任务中表现显著。
完成下面两步后,将自动完成登录并继续当前操作。