基于扩散模型的空间与频率感知图像恢复方法
原文中文,约400字,阅读约需1分钟。发表于: 。通过提出具有高斯噪声的空间和频率感知扩散模型 SaFaRI,我们在各种包括修补、降噪和超分辨率在内的有噪反问题上全面评估了模型的性能,结果显示 SaFaRI 在 ImageNet 和 FFHQ 数据集上表现优于现有的零样本 IR 方法,从 LPIPS 和 FID 指标的角度超越了其他模型,实现了最先进的性能。
本文提出了一种基于条件扩散模型的统一框架,用于图像到图像的转换。通过测试上色、修复、裁剪和JPEG恢复等四个任务,发现该框架在强GAN和回归基线上表现优异,无需超参数调整、架构定制或辅助丢失。研究还揭示了L2和L1损失对扩散目标的影响,以及自我关注在神经结构中的重要性。提倡基于ImageNet的统一评估协议,包括人工评估和样本质量得分,以推进图像到图像翻译研究。展示了通用的多任务扩散模型与任务特定的专家模型相当或更好的执行效果。