基于多架构编码器和特征融合的面部情感识别 ——ABAW7 挑战赛
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了我们在第七次 ABAW 比赛中应对挑战的方法。比赛包括三个子挑战:情绪价值(VA)估计、表情(Expr)分类和动作单元(AU)检测。为了解决这些挑战,我们采用了先进的模型来提取强大的视觉特征。随后,我们利用 Transformer 编码器来整合这些特征,用于 VA、Expr 和 AU...
该研究提出了一种基于Transformer的新框架,通过使用Vision Transformer和Transformer模型,实现了情感估计、面部表情识别和动作元检测。引入了随机帧遮罩的学习技术和Focal损失的应用,增强了情绪和行为分析的准确性和适用性。预计对情感计算和深度学习方法的发展有所助益。