第六届 ABAW 挑战赛上基于视觉语言模型的零样本复合表达识别
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的连续学习方法,通过知识蒸馏和预测排序记忆重放,能够准确识别使用少量训练样本的新复合表情类别。使用GradCAM可视化技术展示了基本和复合面部表情之间的关系,并通过知识蒸馏和记忆重放利用这种关系。该方法在复杂面部表情识别的连续学习方面达到了当前最新水平,新类别的整体准确率为74.28%。与非连续学习方法相比,使用连续学习实现复杂面部表情识别能够获得更好的性能,提高了13.95%的非连续学习方法的最新水平。该研究首次将少样本学习应用于复杂面部表情识别,每个表情类别使用单个训练样本实现了100%的准确率。
🎯
关键要点
- 提出了一种新颖的连续学习方法,灵感来源于人类认知和学习。
- 该方法通过知识蒸馏和预测排序记忆重放,能准确识别使用少量训练样本的新复合表情类别。
- 使用GradCAM可视化技术展示了基本和复合面部表情之间的关系。
- 该方法在复杂面部表情识别的连续学习方面达到了当前最新水平,新类别的整体准确率为74.28%。
- 与非连续学习方法相比,使用连续学习实现复杂面部表情识别能够获得更好的性能,提高了13.95%。
- 首次将少样本学习应用于复杂面部表情识别,每个表情类别使用单个训练样本实现了100%的准确率。
➡️