Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于掩膜的运动轨迹框架,能够将静态图像转化为真实视频序列,有效解决了对象运动不准确和不一致的问题。该方法在多对象和高运动场景中展现了优异的时序一致性和文本提示忠实度。

🎯

关键要点

  • 本研究提出了一种基于掩膜的运动轨迹框架,旨在解决图像到视频生成中的对象运动不准确和不一致的问题。
  • 该方法采用两阶段的组合框架,通过引入基于掩膜的运动轨迹作为中间表示,表达语义对象信息和运动。
  • 研究结果显示,该方法在多对象和高运动场景中展现了优异的时序一致性和文本提示忠实度。
➡️

继续阅读