该研究评估了基于Transformer的语音情感识别模型在多语言中的表现,发现最优层特征显著降低错误率。提出了一种多预训练模型,提升了德语和法语在低资源语言中的准确率。研究还探讨了交叉语料库和数据扩充对模型性能的影响,强调中间层特征在情感信息捕捉中的重要性。
本研究使用神经网络和自监督、弱监督模型的中间层特征表示,结合人类记忆的心理模型,预测助听器用户的可懂度评级,并在不同任务和训练数据中取得了显着性能提升。
完成下面两步后,将自动完成登录并继续当前操作。