学习多轴频域表示在医学图像分割中的应用
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
学习图像压缩 (LIC) 是一种有效的图像存储和传输解决方案。研究者提出了频率感知变换器 (FAT) 模块,实现了对 LIC 的多尺度方向分析。FAT 模块包括频率分解窗口注意力 (FDWA) 模块和频率调制前馈网络 (FMFFN)。实验证明,该方法在速率失真性能上达到了最先进的水平,并在多个数据集上相对于标准编解码器提高了 BD - 率。
🎯
关键要点
- 学习图像压缩 (LIC) 是一种有效的图像存储和传输解决方案。
- 现有的 LIC 方法存在表示冗余问题,限制了对各向异性频率成分和方向细节的捕捉。
- 提出了频率感知变换器 (FAT) 模块,实现了对 LIC 的多尺度方向分析。
- FAT 模块包括频率分解窗口注意力 (FDWA) 模块,用于捕捉多尺度和方向频率成分。
- 引入频率调制前馈网络 (FMFFN),以自适应调制不同频率成分,改善速率失真性能。
- 提出基于变换器的通道级自回归 (T-CA) 模型,有效利用通道依赖性。
- 实验证明,该方法在速率失真性能上达到了最先进的水平。
- 在 Kodak、Tecnick 和 CLIC 数据集上,相对于标准编解码器 VTM-12.1 提高了 14.5%、15.1% 和 13.0% 的 BD - 率。
➡️