利用跨视图对应关系增强文本到三维的三维保真度

原文约500字,阅读约需1分钟。发表于:

利用多视角扩散模型作为 3D 优化的先验条件,缓解了零样本文本到 3D 模型中的 3D 一致性问题,如 Janus 面问题或内容漂移问题。然而,输出的 3D 几何保真度仍然是一个未解决的问题;尽管渲染的 2D 视图是逼真的,但其底层几何可能包含不合理的凹面。我们提出了一种有效的方法 CorrespondentDream,利用来自扩散 U-Net 的无注释交叉视图对应关系,为 NeRF 优化过程提供额外的 3D 先验。我们发现这些对应关系与人类感知力强烈一致,并通过采用它们在我们的损失设计中,能够生成与常识更一致的 NeRF 模型几何,例如更平滑的物体表面,从而提高 3D 保真度。通过各种比较性定性结果和扎实的用户研究,我们证明了我们方法的有效性。

该研究提出了一种名为CorrespondentDream的方法,通过利用扩散U-Net的无注释交叉视图对应关系,为NeRF优化过程提供额外的3D先验。研究发现这些对应关系与人类感知力一致,能够生成更一致的NeRF模型几何,提高3D保真度。通过比较性定性结果和用户研究,证明了该方法的有效性。

相关推荐 去reddit讨论