基于大型语言模型的视频异常检测与解释
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
视频异常检测(VAD)在监控系统中起关键作用,但现有基准数据集限制了VAD模型的发展。本研究引入了两个数据集,挑战模型对多样化异常的识别。同时,提出了一种新方法MFAD,利用多帧特征和逻辑回归增强异常分数计算。实验证实了该方法在简单和复杂异常检测场景中的出色表现。
🎯
关键要点
- 视频异常检测(VAD)在监控系统中扮演关键角色,旨在识别各种异常。
- 现有基准数据集主要关注简单的单帧异常,限制了VAD模型的发展。
- 本研究引入了两个新数据集:HMDB-AD和HMDB-Violence,以挑战模型对多样化异常的识别。
- 新方法Multi-Frame Anomaly Detection(MFAD)基于AI-VAD框架,利用多帧特征和逻辑回归增强异常分数计算。
- 实验结果表明,MFAD在简单和复杂异常检测场景中表现出色,突显了现有模型的局限性。
➡️