Speaker Emotion Recognition: Feature Extraction Using Self-Supervised Models with Wav2Vec2 and HuBERT
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨了使用Wav2Vec2和HuBERT自监督模型进行扬声器情感识别(SER)的特征提取方法。结果表明,该方法在多个数据集上表现优异,并成功应用于呼叫中心的情感预测,具有重要的实际意义。
🎯
关键要点
- 本研究探讨了扬声器情感识别(SER)的重要性和挑战性。
- 研究利用Wav2Vec2和HuBERT自监督模型进行音频信号特征提取。
- 该方法在多个数据集上表现优异,显示出良好的效果。
- 成功应用于呼叫中心的情感预测,具有重要的实际意义。
➡️