文本到视频生成的双流扩散网络

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该论文提出了一种双流扩散网络(DSDN),通过引入交叉变换器交互模块实现内容和动作领域之间的对齐,减少了视频中的闪烁现象。实验证明,该方法能够生成流畅连续且闪烁较少的精彩视频。

🎯

关键要点

  • 该论文提出了一种双流扩散网络(DSDN)。

  • DSDN旨在提高生成视频中内容变化的一致性。

  • 引入交叉变换器交互模块以实现内容和动作领域之间的良好对齐。

  • 该方法减少了视频中的闪烁现象。

  • 定性和定量实验证明该方法能够生成流畅连续且闪烁较少的精彩视频。

➡️

继续阅读