本研究提出了一种自监督方法,解决了从无姿势互联网照片生成视频的问题。该方法利用视频一致性和多视角照片的可变性,训练可扩展的3D感知视频模型,无需3D注释。研究结果表明,该方法在几何和外观一致性方面优于所有基线。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: