本研究提出了一种自监督方法,能够从无姿势的互联网照片生成3D一致性视频。该方法利用视频一致性和多视角照片的可变性,训练可扩展的3D感知视频模型,无需3D注释。实验结果表明,该方法在几何和外观一致性方面优于现有基线,适用于需要摄像机控制的应用。
该论文提出了一种新的视频物体分割方法,结合运动、外观和时间一致性,通过深度学习实现准确的分割与跟踪。研究表明,该模型在多个基准测试中表现优异,尤其在多物体分割上优于现有方法。
MotionCrafter是一种新型的动作定制方法,通过并行时空架构注入参考动作,增强动作与外观的解耦。研究提出个性化的姿态估计器,显著提升视频中的姿态标注精度,并在视频合成中处理异常数据,保持外观一致性,表现优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。