APLA:附加扰动的潜在噪声对抗训练提高一致性

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

APLA是一种基于扩散模型的文本到视频生成网络结构,通过引入视频生成变换器VGT来提取扰动,改善视频帧之间的一致性。实验证明,生成的视频在一致性方面有明显的改进。

🎯

关键要点

  • APLA是一种基于扩散模型的文本到视频生成网络结构。
  • APLA通过引入视频生成变换器VGT来提取扰动,改善视频帧之间的一致性。
  • 该方法仅需要一个视频作为输入,并建立在预训练的稳定扩散网络上。
  • 实验证明,生成的视频在一致性方面有明显的定量和定性改进。
➡️

继续阅读