本研究提出了一种新颖的视觉条件多视角扩散模型See3D,旨在通过大规模互联网视频实现开放世界3D创作。该模型利用纯2D视觉信号,无需姿态条件,显著提升了零-shot与开放世界生成能力,超越了传统3D模型的局限。
本文介绍了CharacterGen框架,通过图像条件的多视角扩散模型和基于转换器的稀疏视角重建模型高效地生成3D角色。实验证明该方法能够生成具有高质量形状和纹理的3D角色。
完成下面两步后,将自动完成登录并继续当前操作。