监控视频中的零样本动作识别

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出利用大型视觉语言模型(LVLMs)提升视频监控系统的动作识别能力。实验结果显示,改进的自反采样方法在UCF-Crime数据集上显著提高了VideoLLaMA2的零样本性能,展现出广泛的应用潜力。

🎯

关键要点

  • 本研究提出利用大型视觉语言模型(LVLMs)提升视频监控系统的动作识别能力。
  • 现有视频监控系统在有限数据集和复杂环境下进行动作识别存在困难。
  • 通过改进的自反采样方法(Self-ReS)进行实验。
  • 实验在UCF-Crime数据集上进行,结果显示VideoLLaMA2的零样本性能显著提升。
  • 研究结果展现出广泛的应用潜力。
➡️

继续阅读