从无姿势互联网照片生成3D一致性视频

BriefGPT - AI 论文速递 ·

本研究提出了一种自监督方法，解决了从无姿势互联网照片生成视频的问题。该方法利用视频一致性和多视角照片的可变性，训练可扩展的3D感知视频模型，无需3D注释。研究结果表明，该方法在几何和外观一致性方面优于所有基线。

3D感知一致性互联网几何一致性外观一致性自监督视频生成

原文中文，约300字，阅读约需1分钟。