本研究提出了一种新颖的视觉条件多视角扩散模型See3D,旨在通过大规模互联网视频实现开放世界3D创作。该模型利用纯2D视觉信号,无需姿态条件,显著提升了零-shot与开放世界生成能力,超越了传统3D模型的局限。
完成下面两步后,将自动完成登录并继续当前操作。