本文介绍了Delphi,一种基于扩散的长视频生成方法,通过共享噪声建模和特征对齐模块提高空间和时间一致性。Delphi在驾驶规划中生成高质量长视频,提升自动驾驶模型的规划性能25%。
该研究提出了一种名为Delphi的基于扩散的长视频生成方法,通过共享噪声建模机制提高空间一致性,并引入特征对齐模块实现精确可控性和时间一致性。实验证明Delphi在驾驶规划中生成更高质量的长视频,提升了自动驾驶模型的规划性能25%。
本研究使用深度学习和多模态传感器融合技术测试了自动驾驶模型在仿真城市驾驶条件下的性能和通用能力。结果显示该模型在定位和避障等任务上表现优于先前模型,验证了多模态传感器融合和场景理解子任务的协同作用提高了模型的性能和可行性。
完成下面两步后,将自动完成登录并继续当前操作。