VaLID:用于新视角合成的可变长度输入扩散
原文中文,约400字,阅读约需1分钟。发表于: 。多视角交叉模块提出了将可变长度的输入数据映射到固定大小的输出数据,进一步提高训练效率的两阶段训练策略。对多个数据集进行定性和定量评估,证明了所提方法相对于以前的方法的有效性。
本文介绍了一种用于野外场景下的单图像新视图合成的三维感知扩散模型ZeroNVS,通过训练生成式先验模型和提出新的相机条件参数化和归一化方案,解决了多物体场景和复杂背景带来的挑战。同时,通过引入“SDS anchoring”改善了合成新视图的多样性。该模型在DTU数据集和Mip-NeRF 360数据集上表现出优异的性能。