VQA²:用于视频质量评估的视觉问答

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了VQA2指令数据集,专注于视频质量评估的视觉问答。基于该数据集开发的VQA2系列模型在视频质量评分任务中表现优异,超越了GPT-4o,展现出良好的多功能性。

🎯

关键要点

  • 本研究提出了VQA2指令数据集,专注于视频质量评估的视觉问答。
  • VQA2系列模型基于该数据集开发,表现优异。
  • VQA2系列模型在视频质量评分任务中超越了GPT-4o。
  • 该模型展现出良好的多功能性。
➡️

继续阅读