用于文本引导图像编辑的可逆一致性蒸馏方法(约 7 步)
原文中文,约400字,阅读约需1分钟。发表于: 。通过应用可逆一致性蒸馏 (invertible Consistency Distillation, iCD) 框架,实现了在少于 4 个推理步骤中高质量图像合成和准确图像编码的目标,使得具有动态引导的 iCD 成为零样本文本引导图像编辑的高效工具。
该研究提出了一种将复杂的多步扩散模型转化为单步有条件生成对抗网络学生模型的方法,以加速推理过程并保持图像质量。通过将扩散模型解释为图像到图像转换任务,并使用扩散模型ODE轨迹的噪声到图像对,实现了高效的回归损失计算。此外,通过改进扩散模型,构建多尺度鉴别器,并建立有效的基于条件生成对抗网络的公式,该方法在零样本COCO基准测试中优于最先进的扩散提炼模型。