MotionEditor是一种视频动作编辑的扩散模型,能够在编辑过程中保留原始背景和主角外貌。该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成,生成与指导文本匹配的视频。此外,研究提出了对象中心扩散技术,降低了计算成本,并引入运动导向技术,允许用户精确编辑图像中对象的布局和姿态。
本研究提出了一种名为LatentWarp的零样本文本引导视频到视频转换框架,旨在实现视频生成的时空一致性。通过空间-时间自我监督学习和文本驱动运动转换方法,提升了视频分析和目标检测的性能,并解决了文本引导视频编辑中的时间不连贯问题。
完成下面两步后,将自动完成登录并继续当前操作。