渐进式自回归视频扩散模型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究提出了一种去噪扩散概率模型的视频建模框架,能够生成长时间视频。该方法优化采样顺序,使用选择性稀疏和长程调节,在多个数据集上表现优于现有技术,生成了长达25分钟的视频。此外,研究还发布了一个基于CARLA自动驾驶模拟器的视频数据集和语义度量。

🎯

关键要点

  • 本研究提出了一种基于去噪扩散概率模型的视频建模框架。
  • 该框架能够在各种真实环境下生成长时间视频。
  • 研究介绍了一种架构,用于有效比较和优化采样顺序。
  • 使用选择性稀疏和长程调节来处理以前采样的帧。
  • 实验结果显示,该方法在多个数据集上优于现有技术,生成了长达25分钟的时间连贯视频。
  • 研究发布了一个基于CARLA自动驾驶模拟器的视频数据集和语义度量。
➡️

继续阅读