用于帧间预测的匀加速运动模型
内容提要
本文提出了一种基于对象分割的帧间预测方法,显著提高了运动向量编码的准确性和效率。实验结果表明,该方法在多种配置下实现了显著的BD速率降低,并且在视频预测和压缩框架中表现优于现有技术,尤其在模型尺寸和编码效率方面。
关键要点
-
提出了一种基于对象分割的帧间预测方法,能够提高运动向量编码的准确性和效率。
-
该方法在运动估计和分区估计的联合率失真优化中考虑分割结果,得出更准确的运动向量和分区。
-
实验结果显示,该方法在低延迟 P、低延迟 B 和随机存取配置下分别实现了 1.98%、1.14% 和 0.79% 的 BD 速率降低。
-
引入了一种端到端可训练的双流视频预测框架(MMVP),提高了视频预测的准确性和效率,并减小了模型尺寸。
-
MMVP 在公共数据集上以小得多的模型尺寸显著优于现有系统,PSNR 提高约 1db。
-
提出了一种多功能的学习视频压缩(VLVC)框架,支持多种预测模式,显著减少体素流的传输成本。
-
VLVC 在 MS-SSIM 方面优于最新 VVC/H.266 标准参考软件,成为首个端到端学习视频压缩方法。
-
MASTC-VC 网络通过变分自编码器学习隐藏表示,显著提高编码效率,平均 BD 速率节省达到 10.15% 和 23.93%。
延伸问答
什么是基于对象分割的帧间预测方法?
基于对象分割的帧间预测方法通过对参考帧中的对象进行分割,利用分割结果提高运动向量编码的准确性和效率。
该方法在实验中实现了怎样的BD速率降低?
该方法在低延迟 P、低延迟 B 和随机存取配置下分别实现了1.98%、1.14%和0.79%的BD速率降低。
MMVP框架的主要优势是什么?
MMVP框架通过分离运动和外观信息,提高了视频预测的准确性和效率,并显著减小了模型尺寸。
VLVC框架的功能是什么?
VLVC框架支持多种预测模式,显著减少体素流的传输成本,并在MS-SSIM方面优于最新的VVC/H.266标准。
MASTC-VC网络如何提高编码效率?
MASTC-VC网络通过变分自编码器学习隐藏表示,结合多尺度运动感知模块和空时域通道上下文模块,提高了编码效率。
该研究的主要贡献是什么?
该研究提出了一种新的视频预测和压缩方法,显著提高了运动向量编码的准确性和效率,并在多种配置下表现优于现有技术。