MotionEditor是一种视频动作编辑的扩散模型,能够在编辑过程中保留原始背景和主角外貌。该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成,生成与指导文本匹配的视频。此外,研究提出了对象中心扩散技术,降低了计算成本,并引入运动导向技术,允许用户精确编辑图像中对象的布局和姿态。
该文介绍了一种可伸缩的无监督面向对象中心的3D场景表示学习方法,通过学习在局部对象坐标系统中视角不变的3D对象表示,从而推断和维护3D场景的对象中心表示。
完成下面两步后,将自动完成登录并继续当前操作。