你看到了,你得到了:在无姿态视频上学习大规模3D创建

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新颖的视觉条件多视角扩散模型See3D,旨在解决现有3D生成模型对有限标签的依赖,通过利用互联网视频实现开放世界的3D创作,显著提升生成能力。

🎯

关键要点

  • 本研究提出了一种新颖的视觉条件多视角扩散模型See3D。
  • See3D旨在解决现有3D生成模型对有限规模3D标签或2D扩散先验的依赖。
  • 该模型通过利用大规模互联网视频实现开放世界的3D创作。
  • See3D的核心贡献在于利用纯粹的2D诱导视觉信号,无需姿态条件。
  • 该模型显著提升了零-shot与开放世界生成能力,超越了传统的3D模型。
➡️

继续阅读