wav2vec 2.0 特征提取器的比较分析
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究通过直接利用六个不同数据集的原始音频文件进行训练,提出了一种用于情感识别的模型。该模型通过多种机器学习算法和深度学习技术进行评估,并与现有方法进行比较。实验证明,该模型在不同数据集上取得了较高的准确率,成为了新的最先进方法。
🎯
关键要点
-
本研究提出了一种用于情感识别的模型,直接利用六个不同数据集的原始音频文件进行训练。
-
该模型没有进行特征提取阶段,使用了多种机器学习算法和深度学习技术进行评估。
-
模型通过支持向量机、决策树、朴素贝叶斯、随机森林等算法进行评估,并与现有方法进行比较。
-
实验证明,该模型在 TESS+RAVDESS 数据集上取得了 95.86% 的准确率,成为新的最先进方法。
-
在说话人无关的音频分类问题中,该模型在 EMO-DB、RAVDESS、TESS 和 SAVEE 数据集上分别取得了 90.34%、90.42%、99.48% 和 85.76% 的准确率。
➡️