基于自我蒸馏的多模态会话情感识别的 Transformer 模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于自蒸馏的变压器模型,通过设计分层门控融合策略动态学习模式之间的权重,并将软标签作为额外的训练监督,学习更具表现力的模式表示。实验证明该模型在IEMOCAP和MELD数据集上优于之前的最先进基线模型。
🎯
关键要点
- 提出了一种基于自蒸馏的变压器模型。
- 模型通过设计分层门控融合策略动态学习模式之间的权重。
- 使用软标签作为额外的训练监督,学习更具表现力的模式表示。
- 实验证明该模型在IEMOCAP和MELD数据集上优于之前的最先进基线模型。
➡️