泛影:面向自动驾驶的全景和可控视频生成
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
该研究提出了一种名为BEVControl的两阶段生成方法,用于提升自动驾驶系统中合成图像的质量。该方法能够生成准确的前景和背景内容,并支持手绘风格的输入。通过实验证明BEVControl在前景分割上比现有方法有显著提升,并证明使用BEVControl生成的图像来训练感知模型能够提高平均NDS分数。
🎯
关键要点
- 该研究提出了一种名为BEVControl的两阶段生成方法,用于提升自动驾驶系统中合成图像的质量。
- BEVControl能够生成准确的前景和背景内容,并支持手绘风格的输入。
- 现有生成网络在仅根据场景级度量评估时能够合成逼真的街景图像,但在放大时无法生成准确的前景和背景细节。
- BEVControl在前景分割mIoU上比现有方法BEVGen有显著提升,从5.89提高到26.80。
- 使用BEVControl生成的图像训练下游感知模型,平均NDS分数提高了1.29。
🏷️
标签
➡️