小红花·文摘

本研究提出了一种新颖的视觉条件多视角扩散模型See3D，旨在通过大规模互联网视频实现开放世界3D创作。该模型利用纯2D视觉信号，无需姿态条件，显著提升了零-shot与开放世界生成能力，超越了传统3D模型的局限。