基于 Swin TransformerV2 和粗糙到精细策略的视频质量评估

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究通过引入经过多个图像质量评估数据集预训练的增强空间感知模块和轻量级的时域融合模块,实现了非参考视频质量评估。

🎯

关键要点

  • 本研究实现了非参考视频质量评估。
  • 引入经过多个图像质量评估数据集预训练的增强空间感知模块。
  • 使用轻量级的时域融合模块。
  • 采用Swin Transformer V2作为本地级别空间特征提取器。
  • 通过一系列Transformer层融合多阶段表示。
  • 利用时域Transformer进行时空特征融合。
  • 采用粗到精的对比策略以适应不同比特率的压缩视频。
➡️

继续阅读