本研究提出了一种新型视频分析系统AVA,基于视频语言模型(VLM),旨在提升开放性分析场景的适应性。AVA通过实时构建事件知识图谱和代理检索生成机制,显著改善复杂查询的表现,并在多个基准测试中超越现有系统,展示了处理超长视频内容的潜力。
完成下面两步后,将自动完成登录并继续当前操作。