斯坦福大学李飞飞团队推出了首个空间智能模型,能够通过单张图片生成3D世界。国内智源研究院的See3D模型则利用无标注互联网视频生成3D图像,支持多种生成和编辑任务,展现出广泛的应用潜力。
本研究提出了一种新颖的视觉条件多视角扩散模型See3D,旨在解决现有3D生成模型对有限标签的依赖,通过利用互联网视频实现开放世界的3D创作,显著提升生成能力。
完成下面两步后,将自动完成登录并继续当前操作。