通过分解编码和条件增强文本到视频生成中的运动

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了新框架DEMO,通过将文本编码分解为内容和运动组件,显著改善了文本到视频生成中的运动表现。

🎯

关键要点

  • 本研究解决了文本到视频生成中视频运动表现不佳的问题。
  • 现有模型无法捕捉复杂的动态表现。
  • 提出了一种新框架DEMO,通过将文本编码和条件分解为内容和运动组件。
  • 显著提高了运动合成效果。
  • 该方法改善了模型对运动的理解与生成。
  • 在多个基准测试上展示了优越的运动动态表现和高视觉质量。
➡️

继续阅读