Cascade-Zero123: 单幅图像到高度一致的 3D 图像的自提近景方法

从一张单一图像中综合多视图 3D 是一项重要且具有挑战性的任务。为了解决这个问题，Zero-1-to-3 方法旨在将二维潜在扩散模型推广到三维范围。我们提出了一个由两个 Zero-1-to-3 模型构建的级联生成框架，名为 Cascade-Zero123，用于解决构建视图之间的几何和视觉一致性的问题。利用自发多视图作为补充信息，我们的 Cascade-Zero123 生成比...

本文介绍了一种用于野外场景下的单图像新视图合成的三维感知扩散模型ZeroNVS。通过训练生成式先验模型和提出新的相机条件参数化和归一化方案，解决了多物体场景和复杂背景带来的挑战。同时，通过引入“SDS anchoring”改善了合成新视图的多样性。该模型在DTU数据集和Mip-NeRF 360数据集上表现出优异的性能。