OVO-Bench:你的视频大语言模型与现实世界在线视频理解的差距有多大?
📝
内容提要
本研究针对现有基准未能充分评估在线视频大语言模型(Video LLMs)在时间感知能力方面的问题,提出了一个新的视频基准OVO-Bench。该基准通过评估Video LLMs在特定时间戳下对事件的推理和回应能力,揭示了现有模型在在线视频理解中的显著不足,旨在推动该领域的进一步研究。
🏷️
标签
➡️