3D高斯点云(3DGS)方法常依赖于像素级损失,导致渲染模糊。研究发现,正则化的Wasserstein失真(WD-R)在恢复细节方面表现优异,超越传统3DGS损失和当前最佳方法。WD-R在多个数据集上实现了最先进的感知质量,并在3DGS场景压缩中节省了约50%的比特率。
本文提出了一种强大的熵模型,能够高效地捕捉视频中的空间和时间依赖关系,并通过内容自适应量化机制实现平滑的速率调整。实验结果表明,该模型在UVG数据集上实现了18.2%的比特率节省,是神经视频编解码器发展的新里程碑。
该研究提出了一种通过参数化和可逆的线性变换来改善屏幕内容图像编码效率的方法。通过设计预处理器和后处理器的两个神经网络,该方法在不改变基线编解码器操作流的情况下,实现了高达10%的比特率节省,只引入了额外的1%参数。
该研究提出了一种名为多模态图像语义压缩(MISC)的方法,采用大型多模态模型(LMM)来平衡传统自然感知图像和人工智能生成图像的压缩,实现了一致性和感知结果的优化,节省了50%的比特率,并在存储和通信领域具有强大的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。