Q-Bench-Video:视频质量理解的基准测试

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了EditVid-QA视频问答基准,涵盖特效、搞笑、网络迷因和游戏四类编辑。研究发现现有的视频LMMs在编辑视频上表现不佳。通过基于Panda-70M/WebVid和TikTok/CapCut视频收集训练集,提升了EditVid-QA的性能。评估中使用GPT-4 judge和关键词过滤来避免“sorry”攻击。数据集仅供学术用途。

🎯

关键要点

  • 构建了EditVid-QA视频问答基准,涵盖特效、搞笑、网络迷因和游戏四类编辑。
  • 现有的视频LMMs在编辑视频上表现较差,存在领域差距。
  • 基于Panda-70M/WebVid和TikTok/CapCut视频收集训练集,提升了EditVid-QA的性能。
  • 使用GPT-4 judge和关键词过滤来避免“sorry”攻击的问题。
  • 数据集仅供学术用途发布。
➡️

继续阅读