基于 GAN 的医学图像增强的频域分解转换

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

该文介绍了一种新颖的频率感知变换器(FAT)模块,用于解决图像压缩中的表示冗余问题,实现了多尺度方向分析。该方法在速率失真性能上达到了最先进的水平,并在多个数据集上相对于最新的标准编解码器提高了BD-率。

🎯

关键要点

  • 学习图像压缩 (LIC) 是图像存储和传输的有效解决方案。
  • 现有的 LIC 方法存在表示冗余问题,限制了对频率成分和方向细节的捕捉。
  • 提出了一种新颖的频率感知变换器 (FAT) 模块,实现了多尺度方向分析。
  • FAT 模块由频率分解窗口注意力 (FDWA) 组成,用于捕捉多尺度和方向频率成分。
  • 引入频率调制前馈网络 (FMFFN) 自适应调制不同频率成分,改善速率失真性能。
  • 提出基于变换器的通道级自回归 (T-CA) 模型,有效利用通道依赖性。
  • 实验证明,该方法在速率失真性能上达到了最先进的水平。
  • 在 Kodak、Tecnick 和 CLIC 数据集上,相对于最新的标准编解码器 VTM-12.1 提高了 14.5%、15.1% 和 13.0% 的 BD - 率。
➡️

继续阅读