MF-AED-AEC: 利用多模态融合、ASR 错误检测和 ASR 错误修正进行语音情感识别
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的端到端语音情感识别系统,利用共同关注机制和多层声学信息。实验证明该系统在IEMOCAP数据集上表现出竞争性能。
🎯
关键要点
- 提出了一种新的端到端语音情感识别系统。
- 系统利用共同关注机制和多层声学信息。
- 提取了 MFCC、谱图和高水平声学信息的多层声学特征。
- 使用 CNN、BiLSTM 和 wav2vec2 进行声学信息提取。
- 通过共同关注机制融合多模态输入。
- 在 IEMOCAP 数据集上的实验显示系统具有竞争性能。
➡️