MegaScenes:大规模场景级别视图合成
原文中文,约400字,阅读约需1分钟。发表于: 。通过从互联网照片收集中创建的大规模场景级数据集,我们分析了现有 NVN 方法的不足,并显著改善了生成一致性,验证了数据集和方法对于生成野外场景的有效性。
该文章介绍了一种用于野外场景下的三维感知扩散模型ZeroNVS,用于单图像新视图合成。通过训练生成式先验模型来处理多物体场景和复杂背景的挑战,并提出了相机条件参数化和归一化方案来解决深度尺度的二义性问题。作者还提出了“SDS anchoring”以改善合成新视图的多样性。该模型在DTU数据集的零样本设置中取得了新的LPIPS优势,并在Mip-NeRF 360数据集上展现出强大的性能。