步骤节约器:扩散模型图像生成的最小降噪步骤预测

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了直接去噪扩散模型(DDDM),一种生成逼真图像的简单且通用方法。DDDM不需要精心设计的采样器或预训练的蒸馏模型,通过考虑前一时间步生成的样本来引导迭代生成过程。该方法在基准数据集上表现出强大的性能,超越了GAN和蒸馏基模型。在ImageNet 64x64上,与主要模型相当。

🎯

关键要点

  • 直接去噪扩散模型(DDDM)是一种生成逼真图像的简单且通用方法。
  • DDDM 具有少步采样的特点,同时保留了多步采样以获得更好的性能。
  • 该模型不需要精心设计的采样器或预训练的蒸馏模型。
  • DDDM 通过考虑前一时间步生成的样本来引导迭代生成过程。
  • 提出了 Pseudo-LPIPS,一种对各种超参数值更鲁棒的新型度量损失。
  • 在基准数据集上,DDDM 表现出强大的性能,超越了 GAN 和蒸馏基模型。
  • 在 CIFAR-10 上,一步采样和两步采样的 FID 分数分别为 2.57 和 2.33。
  • 通过将采样扩展到 1000 步,FID 分数进一步降低到 1.79。
  • 在 ImageNet 64x64 上,DDDM 的表现与主要模型相当。
➡️

继续阅读