小红花·文摘

本文探讨了视频理解中的模型局限性，提出了atemporal probe模型和SPOT Prober方法，以增强事件理解能力。通过MVBench和Event-Bench基准测试，评估视频大型语言模型（Video-LLMs）的表现，发现GPT-4o模型在准确率上优于其他模型。此外，研究提出了HEM-LLM和EventHallusion基准，以解决信息冗余和幻觉问题，推动视频理解领域的发展。

E.T.基准：迈向开放式事件级视频语言理解

BriefGPT - AI 论文速递 ·

MAVEN-Arg是一个全方位支持事件理解的数据集，包括事件检测、参数提取和关系提取。它提供了全面的架构、大规模数据和详尽的标注。对于事件参数提取模型和大型语言模型具有挑战，并展示了未来事件预测的潜在应用。

MAVEN-Arg: 全方位事件理解数据集的事件论证注释

BriefGPT - AI 论文速递 ·