该研究使用西班牙的情感数据集,创建了基于说话者的情感识别模型,并比较了不同数据库的结果。使用预训练模型和特征组合取得了较高的准确率,对于情感价值和唤醒度的预测分别达到了61.64%和55.57%的准确率。研究发现,注释者标签的变化会影响结果,结合专家和非专家的注释可以获得更好的结果和公平性。该研究对于分析即兴语音消息的应用程序开发具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。