小红花·文摘

MotionEditor是一种视频动作编辑的扩散模型，能够在编辑过程中保留原始背景和主角外貌。该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成，生成与指导文本匹配的视频。此外，研究提出了对象中心扩散技术，降低了计算成本，并引入运动导向技术，允许用户精确编辑图像中对象的布局和姿态。

BriefGPT - AI 论文速递 ·

本研究提出了一种名为LatentWarp的零样本文本引导视频到视频转换框架，旨在实现视频生成的时空一致性。通过空间-时间自我监督学习和文本驱动运动转换方法，提升了视频分析和目标检测的性能，并解决了文本引导视频编辑中的时间不连贯问题。

BriefGPT - AI 论文速递 ·