BriefGPT - AI 论文速递 ·

利用掩模自编码器、时域卷积网络和转换器进行连续情感识别的自预训练强化

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了在第四届野外情感行为分析竞赛中提出的多任务学习方法，利用深度模型提取情感特征，显著提高了情感分类和评估的准确性。研究表明，基于Transformer的架构和EfficientNet模型在实时视频情感分析中表现优异，尤其在多模态特征提取和情感反应强度评估方面超越了基线方法。

🎯

❓

提出了一种多任务学习方法，利用面部和背景信息进行情感分类和评估。

EfficientNet模型在实时视频情感分析中表现优异，超越了VggFace基线。

Transformer架构能够在模态缺失的情况下识别情绪，提升对弱显著输入的学习效果。

通过半监督学习技术生成未标记面部数据的表情类别伪标签，并采用均匀抽样和去偏反馈学习策略。

提出的方法在情感反应强度评估方面超越了基线方法84%，在验证数据集上取得了优秀结果。

使用wav2vec和BERT联合进行特征提取，在连续情感识别任务中表现非常合适，CCC值达到0.825。

🏷️