本文提出了一种强大的熵模型,能够高效地捕捉视频中的空间和时间依赖关系,并通过内容自适应量化机制实现平滑的速率调整。实验结果表明,该模型在UVG数据集上实现了18.2%的比特率节省,是神经视频编解码器发展的新里程碑。
研究人员提出了一种名为GroupedMixer的新型基于Transformer的熵模型,具有更快的编码速度和更好的压缩性能。实验结果表明,GroupedMixer在快速压缩速度下具有最先进的失真率性能。
完成下面两步后,将自动完成登录并继续当前操作。