端到端可微分仿真的自主车辆控制器

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文提出了一种离线策略梯度方法,通过构建可微分的数据驱动模拟器来学习城市驾驶的模仿策略。通过在100小时的专家演示上进行训练,展示其能够学习出高泛化性能和多种驾驶动作的城市驾驶策略,并且无需进行复杂的状态扰动或采集进一步的在线策略数据而在真实世界中优于现有的最新城市驾驶方案。

原文中文,约200字,阅读约需1分钟。
阅读原文