使用受控的多视图编辑的通用 3D 扩散适配器

原文约400字,阅读约需1分钟。发表于:

MVEdit 是一个高度灵活和可扩展的框架,结合了多视角扩散和祖先采样技术,在只需 2-5 分钟的推理时间内实现了在质量和速度之间更好的平衡,对于开放领域的 3D 对象合成,多视角扩散以及高质量贴图生成等应用具有具有最先进性能的评估结果。

本研究提出了一种名为MVDiffusion++的神经架构,用于3D物体重建。该架构通过图像生成物体的密集高分辨率视图,采用了无姿态架构和视图丢弃策略,实现了3D一致性和密集高分辨率视图合成。实验结果表明,MVDiffusion++在新视图合成和3D重建方面优于当前技术水平。同时,该架构还展示了文本到3D的应用示例。

相关推荐 去reddit讨论