ExpLLM:面部表情识别中的思维链探索
原文中文,约200字,阅读约需1分钟。发表于: 。该研究解决了当前面部表情识别(FER)方法在分析面部表情原因方面的不足,提出了一种名为ExpLLM的新方法,结合大型语言模型生成准确的思维链。研究表明,ExpLLM在RAF-DB和AffectNet数据集上的性能优于现有的FER方法,特别是在微表情识别领域显著优于最新的GPT-4o。
本文介绍了一种半监督学习技术,用于生成未标记面部数据的表情类别伪标签,以解决FER数据集的泛化能力问题。该方法采用均匀抽样和去偏反馈学习策略来处理类别不平衡和数据偏差问题。同时引入时间编码器来学习和捕捉静态图像之间的临近表情特征的时间关系。在ABAW竞赛中取得了优秀成绩,证实了该方法的有效性和竞争力。