MagicDrive: 带有多样化三维几何控制的街景生成

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该文介绍了一种名为BEVControl的两阶段生成方法,支持手绘风格的输入,可以生成准确的前景和背景内容。实验表明,BEVControl在前景分割mIoU上比现有方法BEVGen有显着提升,从5.89到26.80。使用BEVControl生成的图像来训练下游感知模型,平均NDS分数提高了1.29。

🎯

关键要点

  • 该文介绍了一种名为BEVControl的两阶段生成方法。
  • BEVControl支持手绘风格的输入,能够生成准确的前景和背景内容。
  • BEVControl在前景分割mIoU上比现有方法BEVGen有显著提升,从5.89提高到26.80。
  • 使用BEVControl生成的图像训练下游感知模型,平均NDS分数提高了1.29。
  • 提出了一个全面的多级评估协议,以公平比较生成的场景、前景对象和背景几何的质量。
➡️

继续阅读