BriefGPT - AI 论文速递 ·

编辑你的动作：时空扩散解耦学习用于视频动作编辑

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

MotionEditor是一种视频动作编辑的扩散模型，能够在编辑过程中保留原始背景和主角外貌。该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成，生成与指导文本匹配的视频。此外，研究提出了对象中心扩散技术，降低了计算成本，并引入运动导向技术，允许用户精确编辑图像中对象的布局和姿态。

🎯

❓

MotionEditor是一种用于视频动作编辑的扩散模型，能够在编辑过程中保留原始背景和主角外貌。

该模型结合文本驱动的运动转换方法、时序信息和高分辨率生成，生成与指导文本匹配的视频。

对象中心扩散技术显著降低了计算成本，并实现了高达10倍的延迟降低。

运动导向技术允许用户指定复杂的运动场，精确编辑图像中对象的布局、位置、姿态和形状。

通过解耦场景和物体运动信息，MotionEditor增强了对物体运动信息的关注，减少了场景信息的影响。

MotionEditor适用于视频动作编辑，特别是在需要保留原始背景和主角外貌的情况下。

🏷️