💡 原文中文,约6000字,阅读约需15分钟。
📝

内容提要

本文提出了一种动态状态空间模型Content-Aware Mamba(CAM),并基于此构建了图像压缩模型CMIC。CMIC通过内容自适应token重排和全局先验提示,增强了长距离冗余建模能力,在多个数据集上实现了SOTA性能。

🎯

关键要点

  • 提出了一种动态状态空间模型Content-Aware Mamba(CAM)
  • 基于CAM构建了图像压缩模型CMIC
  • CMIC通过内容自适应token重排和全局先验提示增强长距离冗余建模能力
  • CMIC在Kodak、Tecnick和CLIC数据集上实现了SOTA性能
  • 标准Mamba在图像压缩中存在固定raster scan和严格因果建模的瓶颈
  • CMIC引入内容自适应token重排(CTP)以优化扫描顺序
  • CMIC使用全局先验提示(GPP)来缓解严格因果约束
  • CMIC的设计兼顾局部细节和全局压缩效率
  • CMIC在多个数据集上相对VTM-21.0取得显著的码率节省
  • CMIC的参数量和计算复杂度相对较低,具有较高的效率
  • CMIC通过有效感受野(ERF)展示了对冗余分布的感知能力
  • CMIC的核心在于优化扫描顺序和信息流方式以提升图像压缩性能
➡️

继续阅读