APLA:附加扰动的潜在噪声对抗训练提高一致性
💡
原文中文,约2500字,阅读约需6分钟。
📝
内容提要
APLA是一种基于扩散模型的文本到视频生成网络结构,通过引入视频生成变换器VGT来提取扰动,改善视频帧之间的一致性。实验证明,生成的视频在一致性方面有明显的改进。
🎯
关键要点
- APLA是一种基于扩散模型的文本到视频生成网络结构。
- APLA通过引入视频生成变换器VGT来提取扰动,改善视频帧之间的一致性。
- 该方法仅需要一个视频作为输入,并建立在预训练的稳定扩散网络上。
- 实验证明,生成的视频在一致性方面有明显的定量和定性改进。
➡️