小红花·文摘

该研究提出了一种新型闭环仿真器，解决了模仿学习在自动驾驶规划中的局限性。通过引入Waymo数据集的因果基准，评估模仿问题的影响，并结合模仿学习与强化学习，显著提升了模型的泛化能力。