高保真神经图像压缩的语义集成损失和潜在精炼
原文中文,约300字,阅读约需1分钟。发表于: 。该研究提出了一种改进的神经压缩方法,通过使用复杂的语义集成损失、潜在精细化过程和优化可视保真度的目标,显著提高了神经图像压缩的统计保真度,并在 CLIC2024 验证集上相较于 MS-ILLM 在 FID 指标下实现了 62% 的比特率节省。
本研究提出了一种端到端学习的图像压缩编解码器,通过同时训练分析变换和目标分类任务,证实压缩的潜在表示能够准确预测人的感知距离判断。研究还展示了将分析变换作为图像任务的感知损失网络的有效性。实验结果表明,现有的神经编码器在感知建模方面表现出色,无需额外的VGG网络。该研究对开发语义感知和编码高效的神经编码器具有参考价值。