PaGoDA: 从低分辨率扩散指导者逐步生成一步生成器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种新的自级联扩散模型,用于快速生成高分辨率图像和视频。该模型利用低分辨率模型的知识,通过多尺度上采样器模块适应更高的分辨率,并提高局部结构细节。实验证明,该方法训练速度提高了5倍,仅需额外的0.002M调优参数。

🎯

关键要点

  • 提出了一种新颖的自级联扩散模型,用于快速生成高分辨率图像和视频。
  • 该模型利用低分辨率模型的知识,通过多尺度上采样器模块适应更高的分辨率。
  • 整合了一系列多尺度上采样器模块,保持原始组合和生成能力。
  • 提出了一种基于中心引导的噪声重新调度策略,加快推理过程并提高局部结构细节。
  • 与完全微调相比,训练速度提高了5倍,仅需额外的0.002M调优参数。
  • 实验表明,仅需10k步的微调即可快速适应更高分辨率的图像和视频合成,几乎不增加推理时间。
➡️

继续阅读