小红花·文摘

本文提出了一种新框架用于解决类别增量视频分类（CIVC）任务，能够持续更新新类别并保持旧知识。通过自监督学习和半监督学习方法，提升了视频分类和动作检测的性能，尤其在少量标注样本情况下表现优异。研究还探讨了音频-视觉类增量学习和虚拟类别的应用，显著提高了模型的优化能力和准确性。