第六届 ABAW 挑战赛上基于视觉语言模型的零样本复合表达识别

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新的连续学习方法,通过知识蒸馏和预测排序记忆重放,能够准确识别使用少量训练样本的新复合表情类别。使用GradCAM可视化技术展示了基本和复合面部表情之间的关系,并通过知识蒸馏和记忆重放利用这种关系。该方法在复杂面部表情识别的连续学习方面达到了当前最新水平,新类别的整体准确率为74.28%。与非连续学习方法相比,使用连续学习实现复杂面部表情识别能够获得更好的性能,提高了13.95%的非连续学习方法的最新水平。该研究首次将少样本学习应用于复杂面部表情识别,每个表情类别使用单个训练样本实现了100%的准确率。

🎯

关键要点

  • 提出了一种新颖的连续学习方法,灵感来源于人类认知和学习。
  • 该方法通过知识蒸馏和预测排序记忆重放,能准确识别使用少量训练样本的新复合表情类别。
  • 使用GradCAM可视化技术展示了基本和复合面部表情之间的关系。
  • 该方法在复杂面部表情识别的连续学习方面达到了当前最新水平,新类别的整体准确率为74.28%。
  • 与非连续学习方法相比,使用连续学习实现复杂面部表情识别能够获得更好的性能,提高了13.95%。
  • 首次将少样本学习应用于复杂面部表情识别,每个表情类别使用单个训练样本实现了100%的准确率。
➡️

继续阅读