BriefGPT - AI 论文速递 ·

CutDiffusion: 一个简单、快速、廉价且强大的扩散外推方法

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

本文介绍了多种创新的扩散模型方法，包括Patch Diffusion框架、DistriFusion高效图像生成、DiffFit快速适应新领域和自级联扩散模型。这些方法通过优化训练过程、提高生成速度和图像质量，推动了超高分辨率图像合成的研究进展。

🎯

提出了名为 Patch Diffusion 的通用 Patch-wise 训练框架，通过新的条件分数函数和多尺度随机 Patch 大小训练，显著减少训练时间并提高数据效率。
DistriFusion 方法利用并行处理和分布式计算，解决高分辨率图像生成中的计算资源和延迟问题，实现高达 6.1 倍的速度提升，且质量损失较低。
DiffFit 是一种参数高效的策略，通过微调特定层的偏差项和新加入的缩放因子，实现对新领域的快速适应，训练加速达到 2 倍，且在多个数据集上表现突出。
自级联扩散模型利用低分辨率模型的知识快速适应高分辨率图像和视频生成，训练速度提高 5 倍，仅需额外的 0.002M 调优参数。
DeepCache 是一种无训练的范式，通过利用去噪步骤中的时间冗余，加速扩散模型，Stable Diffusion v1.5 和 LDM-4-G 的速度提升分别为 2.3 倍和 4.1 倍。
提出基于小波的扩散方案，旨在缩小扩散模型与 GAN 模型之间的速度差距，为实现实时高保真扩散模型奠定基础。
ElasticDiffusion 是一种新的无需训练的解码方法，能够生成不同尺寸的图像。
结合漏光图像的扩散模型和基于物理的曝光模型，改进图像增强方法，具有更好的泛化能力。
通过频率截断的方法，提出了一种新颖的 fine-tuning 自由方法，改善扩散模型的引导，在各种编辑任务中表现出色。

❓

Patch Diffusion 方法的核心创新是新的条件分数函数，通过在原始图像的 Patch 级别包括 Patch 位置作为附加坐标通道，显著减少训练时间并提高数据效率。

DistriFusion 方法通过并行处理和分布式计算，实现高达 6.1 倍的速度提升，同时保持较低的质量损失。

DiffFit 是一种参数高效的策略，通过微调特定层的偏差项和新加入的缩放因子，实现对新领域的快速适应，训练加速达到 2 倍。

自级联扩散模型利用低分辨率模型的知识快速适应高分辨率图像和视频生成，训练速度提高 5 倍，仅需额外的 0.002M 调优参数。

DeepCache 方法通过利用去噪步骤中的时间冗余，加速扩散模型，实现了 Stable Diffusion v1.5 和 LDM-4-G 的速度提升，分别为 2.3 倍和 4.1 倍。

基于小波的扩散方案旨在缩小扩散模型与 GAN 模型之间的速度差距，为实现实时高保真扩散模型奠定基础。

🏷️