频率感知变换器用于学习图像压缩

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该文介绍了一种新颖的频率感知变换器 (FAT) 模块,用于改善学习图像压缩 (LIC) 方法的速率失真性能。作者还提出了基于变换器的通道级自回归 (T-CA) 模型,实验证明该方法在速率失真性能上达到了最先进的水平。

🎯

关键要点

  • 学习图像压缩 (LIC) 是图像存储和传输的有效解决方案,但存在表示冗余问题。
  • 提出了一种新颖的频率感知变换器 (FAT) 模块,实现了对 LIC 的多尺度方向分析。
  • FAT 模块由频率分解窗口注意力 (FDWA) 组成,用于捕捉多尺度和方向频率成分。
  • 引入频率调制前馈网络 (FMFFN) 自适应调制不同频率成分,改善速率失真性能。
  • 提出基于变换器的通道级自回归 (T-CA) 模型,有效利用通道依赖性。
  • 实验证明该方法在速率失真性能上达到了最先进的水平,BD-率在多个数据集上显著提高。
➡️

继续阅读