MF-AED-AEC: 利用多模态融合、ASR 错误检测和 ASR 错误修正进行语音情感识别

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新的端到端语音情感识别系统,利用共同关注机制和多层声学信息。实验证明该系统在IEMOCAP数据集上表现出竞争性能。

🎯

关键要点

  • 提出了一种新的端到端语音情感识别系统。
  • 系统利用共同关注机制和多层声学信息。
  • 提取了 MFCC、谱图和高水平声学信息的多层声学特征。
  • 使用 CNN、BiLSTM 和 wav2vec2 进行声学信息提取。
  • 通过共同关注机制融合多模态输入。
  • 在 IEMOCAP 数据集上的实验显示系统具有竞争性能。
➡️

继续阅读