BriefGPT - AI 论文速递 ·

SIAVC：工业事故视频分类的半监督框架

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文提出了一种新框架用于解决类别增量视频分类（CIVC）任务，能够持续更新新类别并保持旧知识。通过自监督学习和半监督学习方法，提升了视频分类和动作检测的性能，尤其在少量标注样本情况下表现优异。研究还探讨了音频-视觉类增量学习和虚拟类别的应用，显著提高了模型的优化能力和准确性。

🎯

❓

类别增量视频分类（CIVC）任务是指在不断更新新类别的同时，保持旧视频知识的一种视频分类任务。

该框架通过自监督学习和半监督学习方法，在少量标注样本情况下显著提升了视频分类和动作检测的性能。

通过引入双通道音频-视觉相似性约束和视觉注意聚焦的方法，显著提高了音频-视觉类增量学习的效果。

该研究在Something-Something V2和Kinetics数据集上进行了评估。

虚拟类别方法在处理困惑样本时，无需进行标签修正，从而提高模型的优化能力和嵌入空间的质量。

半监督主动学习方法结合标记和未标记数据，通过信息样本选择来提高视频动作检测的准确性和泛化能力。

🏷️