Flash Diffusion: 加速任何有条件扩散模型的少步图像生成
原文中文,约400字,阅读约需1分钟。发表于: 。本论文提出了一种高效、快速和多功能的蒸馏方法,Flash Diffusion,用于加速预训练扩散模型的生成,在 COCO2014 和 COCO2017 数据集上,在少量步骤的图像生成方面表现出最先进的 FID 和 CLIP-Score 性能,只需几个 GPU 小时的训练和比现有方法少得多的可训练参数。
本文介绍了一种将复杂的多步扩散模型提炼为单步有条件生成对抗网络学生模型的方法,以加速推理过程并保持图像质量。该方法使用扩散模型的噪声到图像对进行图像转换任务,并提出了一种在扩散模型潜空间中操作的感知损失。实验证明该方法在零样本 COCO 基准测试上优于最先进的一步扩散提炼模型。