DragAnything:使用实体表示的任意物体运动控制
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
DragAnything是一种利用实体表示来实现对可控视频生成中的任何对象的运动控制的方法。与现有方法相比,DragAnything具有易于用户交互、不需要其他指导信号的工作字眼以及能够同时对多个对象进行不同的运动控制等优势。实验证明,DragAnything在性能方面表现出色,尤其在对象运动控制方面。
🎯
关键要点
-
DragAnything是一种利用实体表示实现可控视频生成中对象运动控制的方法。
-
DragAnything相比现有方法具有易于用户交互的优势,不需要其他指导信号。
-
用户只需绘制一条线(轨迹)即可进行交互。
-
实体表示作为开放域嵌入,能够表示任何对象,实现对各种实体的运动控制。
-
DragAnything允许同时对多个对象进行不同的运动控制。
-
大量实验证明,DragAnything在FVD、FID和用户研究方面表现出色,尤其在对象运动控制方面。
-
DragAnything在人类投票中比以前的方法提高了26%。
🏷️
标签
➡️