本文提出了一种新框架用于解决类别增量视频分类(CIVC)任务,能够持续更新新类别并保持旧知识。通过自监督学习和半监督学习方法,提升了视频分类和动作检测的性能,尤其在少量标注样本情况下表现优异。研究还探讨了音频-视觉类增量学习和虚拟类别的应用,显著提高了模型的优化能力和准确性。
完成下面两步后,将自动完成登录并继续当前操作。