SCBench: A Benchmark for Sports Commentary Generation in Video Large Language Models
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了体育视频评论生成的新任务及基准SCBench,评估视频大型语言模型的细粒度时序视觉能力。结果显示,InternVL-Chat-2在该基准上表现最佳,为复杂视觉理解任务提供了新视角。
🎯
关键要点
-
本研究提出了体育视频评论生成的新任务及基准SCBench。
-
研究评估视频大型语言模型在细粒度时序视觉能力方面的不足。
-
引入六维评分标准和包含5775个注释视频片段的CommentarySet数据集。
-
结果显示,InternVL-Chat-2在该基准上表现最佳。
-
研究提升了复杂视觉理解任务的模型能力,为今后的研究提供了新视角。
🏷️