冷酷时尚的视频:以 800 个参数进行学习式视频编码

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于梯度衰减和自适应分层蒸馏的新型模型不可知剪枝方案,应用于三种视频编码器,结果显示在MACS上减少了65%,速度提升了2倍。

🎯

关键要点

  • 端到端学习的视频编码器在压缩效率方面与传统编码算法竞争。
  • 大多数基于学习的视频压缩模型存在高计算复杂性和延迟问题,限制实际应用。
  • 提出了一种基于梯度衰减和自适应分层蒸馏的新型模型不可知剪枝方案。
  • 梯度衰减增强了稀疏化过程中的参数探索,防止过度稀疏。
  • 自适应分层蒸馏根据中间特征的失真情况调整稀疏训练,更新参数的计算开销最小。
  • 该方法应用于三种视频编码器:FVC、DCVC 和 DCVC-HEM。
  • 结果显示在 MACS 上减少了65%,速度提升了2倍,BD-PSNR下降不到0.3dB。
  • 支持代码和补充材料可从指定网址下载。
➡️

继续阅读