LAVIE:级联潜在扩散模型的高质量视频生成

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

LaVie视频生成框架利用预训练的文本到图像模型生成高质量的文本到视频模型,通过时间自注意机制和联合图像-视频微调生成视觉逼真且时间连贯的视频,并保留预训练T2I模型的创造性。经实验证明,LaVie在性能上表现最先进,可用于不同的长视频生成和个性化视频合成应用。

🎯

关键要点

  • LaVie是一个整合的视频生成框架。
  • 该框架利用预训练的文本到图像模型生成高质量的文本到视频模型。
  • 引入时间自注意机制和联合图像-视频微调,生成视觉逼真且时间连贯的视频。
  • LaVie保留了预训练T2I模型的创造性。
  • 经实验证明,LaVie在性能上表现最先进。
  • LaVie可用于不同的长视频生成和个性化视频合成应用。
➡️

继续阅读