小红花·文摘

本研究提出了一种新型视频分析系统AVA，基于视频语言模型（VLM），旨在提升开放性分析场景的适应性。AVA通过实时构建事件知识图谱和代理检索生成机制，显著改善复杂查询的表现，并在多个基准测试中超越现有系统，展示了处理超长视频内容的潜力。