本研究提出了一种自监督方法,能够从无姿势的互联网照片生成3D一致性视频。该方法利用视频一致性和多视角照片的可变性,训练可扩展的3D感知视频模型,无需3D注释。实验结果表明,该方法在几何和外观一致性方面优于现有基线,适用于需要摄像机控制的应用。
完成下面两步后,将自动完成登录并继续当前操作。