该研究评估了基于Transformer的语音情感识别模型在多语言中的表现,发现最优层特征显著降低错误率。提出了一种多预训练模型,提升了德语和法语在低资源语言中的准确率。研究还探讨了交叉语料库和数据扩充对模型性能的影响,强调中间层特征在情感信息捕捉中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。