XLD:用于评估新型驾驶视角合成的跨车道数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种用于野外场景下的三维感知扩散模型ZeroNVS,用于单图像新视图合成。通过训练生成式先验模型来处理多物体场景和复杂背景的挑战,并提出了相机条件参数化和归一化方案来解决深度尺度的二义性问题。文章还提出了“SDS anchoring”方法来改善合成新视图的多样性。该模型在DTU数据集的零样本设置中表现出优势,并在Mip-NeRF 360数据集上展现出强大的性能。

🎯

关键要点

  • 介绍了一种三维感知扩散模型ZeroNVS,用于单图像新视图合成。
  • 通过训练生成式先验模型处理多物体场景和复杂背景的挑战。
  • 提出了相机条件参数化和归一化方案,解决深度尺度的二义性问题。
  • 提出了“SDS anchoring”方法,改善合成新视图的多样性。
  • 模型在DTU数据集的零样本设置中表现出新的LPIPS优势。
  • 在Mip-NeRF 360数据集上展现出强大的性能,成为新基准。
➡️

继续阅读