本研究提出了一种端到端学习的图像压缩编解码器,通过同时训练分析变换和目标分类任务,证实压缩的潜在表示能够准确预测人的感知距离判断。实验结果显示,现成的神经编码器在感知建模方面表现出色,无需额外的VGG网络。该研究对开发语义感知和编码高效的神经编码器具有参考价值。
当前,对基于神经网络的图像压缩编解码器有很高的需求。该模型利用神经网络,在基本运行点上超过传统编解码器的10% BD率,并通过在空间域中灵活分配位分布,与VVC intra的锚点生成恒定质量点的方式形成鲜明对比。应用VVC的位分布策略,可以进一步提高JPEG-AI的客观性能,使PSNR-Y获得最大增益0.45 dB。
本研究提出了一种端到端学习的图像压缩编解码器,通过同时训练分析变换和目标分类任务,证实压缩的潜在表示能够准确预测人的感知距离判断。研究还展示了将分析变换作为图像任务的感知损失网络的有效性。实验结果表明,现有的神经编码器在感知建模方面表现出色,无需额外的VGG网络。该研究对开发语义感知和编码高效的神经编码器具有参考价值。
本研究提出了一种端到端学习的图像压缩编解码器,通过同时训练分析变换和目标分类任务,证实压缩的潜在表示能够准确预测人的感知距离判断。实验结果显示,现成的神经编码器在感知建模方面表现出色,无需额外的VGG网络。这项研究对于开发语义感知和编码高效的神经编码器具有重要参考价值。
完成下面两步后,将自动完成登录并继续当前操作。