用于帧间预测的匀加速运动模型

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

本文提出了一种基于对象分割的帧间预测方法,显著提高了运动向量编码的准确性和效率。实验结果表明,该方法在多种配置下实现了显著的BD速率降低,并且在视频预测和压缩框架中表现优于现有技术,尤其在模型尺寸和编码效率方面。

🎯

关键要点

  • 提出了一种基于对象分割的帧间预测方法,能够提高运动向量编码的准确性和效率。

  • 该方法在运动估计和分区估计的联合率失真优化中考虑分割结果,得出更准确的运动向量和分区。

  • 实验结果显示,该方法在低延迟 P、低延迟 B 和随机存取配置下分别实现了 1.98%、1.14% 和 0.79% 的 BD 速率降低。

  • 引入了一种端到端可训练的双流视频预测框架(MMVP),提高了视频预测的准确性和效率,并减小了模型尺寸。

  • MMVP 在公共数据集上以小得多的模型尺寸显著优于现有系统,PSNR 提高约 1db。

  • 提出了一种多功能的学习视频压缩(VLVC)框架,支持多种预测模式,显著减少体素流的传输成本。

  • VLVC 在 MS-SSIM 方面优于最新 VVC/H.266 标准参考软件,成为首个端到端学习视频压缩方法。

  • MASTC-VC 网络通过变分自编码器学习隐藏表示,显著提高编码效率,平均 BD 速率节省达到 10.15% 和 23.93%。

延伸问答

什么是基于对象分割的帧间预测方法?

基于对象分割的帧间预测方法通过对参考帧中的对象进行分割,利用分割结果提高运动向量编码的准确性和效率。

该方法在实验中实现了怎样的BD速率降低?

该方法在低延迟 P、低延迟 B 和随机存取配置下分别实现了1.98%、1.14%和0.79%的BD速率降低。

MMVP框架的主要优势是什么?

MMVP框架通过分离运动和外观信息,提高了视频预测的准确性和效率,并显著减小了模型尺寸。

VLVC框架的功能是什么?

VLVC框架支持多种预测模式,显著减少体素流的传输成本,并在MS-SSIM方面优于最新的VVC/H.266标准。

MASTC-VC网络如何提高编码效率?

MASTC-VC网络通过变分自编码器学习隐藏表示,结合多尺度运动感知模块和空时域通道上下文模块,提高了编码效率。

该研究的主要贡献是什么?

该研究提出了一种新的视频预测和压缩方法,显著提高了运动向量编码的准确性和效率,并在多种配置下表现优于现有技术。

➡️

继续阅读