BriefGPT - AI 论文速递 ·

EmoBox: 跨语言多语料库语音情感识别工具箱与基准

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

该研究评估了基于Transformer的语音情感识别模型在多语言中的表现，发现最优层特征显著降低错误率。提出了一种多预训练模型，提升了德语和法语在低资源语言中的准确率。研究还探讨了交叉语料库和数据扩充对模型性能的影响，强调中间层特征在情感信息捕捉中的重要性。

🎯

❓

EmoBox是一个跨语言多语料库的语音情感识别工具箱，旨在评估基于Transformer的语音情感识别模型的性能。

研究提出了一种语言特定的多预训练语音模型，分别提高了德语和法语的准确率，提升幅度为3%和14.3%。

中间层的语音模型对于捕捉重要情感信息至关重要，能够显著提升情感识别的效果。

研究发现，使用混合语料库的模型在失配条件下更稳定，数据扩充对模型性能的提升更为明显。

使用Transformer模型的情感识别系统在7个数据集上平均降低了32%的错误率，显示出良好的性能。

实验结果表明，仅使用语音模型最优层的特征可以显著降低错误率，并且中间层特征对情感信息捕捉至关重要。

🏷️