该文章介绍了一种用于野外场景下的单图像新视图合成的三维感知扩散模型ZeroNVS。通过训练生成式先验模型来处理多物体场景和复杂背景的挑战,并提出了相机条件参数化和归一化方案来解决深度尺度的二义性问题。作者还注意到Score Distillation Sampling(SDS)在蒸馏360度场景时倾向于截断复杂背景的分布,并提出了“SDS anchoring”以改善合成新视图的多样性。该模型在DTU数据集的零样本设置中取得了新的LPIPS优势,并在Mip-NeRF 360数据集上展现出强大的性能。
本文介绍了一种用于野外场景下的单图像新视图合成的三维感知扩散模型ZeroNVS。通过训练生成式先验模型和提出新的相机条件参数化和归一化方案,解决了多物体场景和复杂背景带来的挑战。同时,通过改进Score Distillation Sampling(SDS)和提出“SDS anchoring”,改善了合成新视图的多样性。该模型在DTU数据集的零样本设置中表现出优势,并在Mip-NeRF 360数据集上展现了强大的性能。
完成下面两步后,将自动完成登录并继续当前操作。