该研究提出了一种新型闭环仿真器,解决了模仿学习在自动驾驶规划中的局限性。通过引入Waymo数据集的因果基准,评估模仿问题的影响,并结合模仿学习与强化学习,显著提升了模型的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。