SCBench: A Benchmark for Sports Commentary Generation in Video Large Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了体育视频评论生成的新任务及基准SCBench,评估视频大型语言模型的细粒度时序视觉能力。结果显示,InternVL-Chat-2在该基准上表现最佳,为复杂视觉理解任务提供了新视角。

🎯

关键要点

  • 本研究提出了体育视频评论生成的新任务及基准SCBench。
  • 研究评估视频大型语言模型在细粒度时序视觉能力方面的不足。
  • 引入六维评分标准和包含5775个注释视频片段的CommentarySet数据集。
  • 结果显示,InternVL-Chat-2在该基准上表现最佳。
  • 研究提升了复杂视觉理解任务的模型能力,为今后的研究提供了新视角。
➡️

继续阅读