本研究提出开放词汇音视频事件定位(OV-AVEL)任务,解决了音视频事件定位中对未知事件类别处理不足的问题。通过引入OV-AVEBench数据集和基准方法,显著提升了开放集环境下的音视频事件识别能力。
完成下面两步后,将自动完成登录并继续当前操作。