一种改进的变分模态分解算法对语音情感识别性能的影响

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究探讨了深度学习技术在语音情绪识别中的应用,提供了一个综合的解决方案,通过将说话人分离流程与基于卷积神经网络构建的情绪识别模型相结合,实现了更高的准确性。该模型经过五个语音情绪数据集的训练,使用了多种特征提取方法,能够以63%的准确率识别语音信号中的情绪状态,展示了出色的效率。

🎯

关键要点

  • 本研究探讨了深度学习技术在语音情绪识别中的应用。
  • 提供了一个综合的解决方案,解决了说话人分离和情绪识别中的挑战。
  • 引入了一个框架,将说话人分离流程与基于卷积神经网络的情绪识别模型相结合。
  • 模型经过五个语音情绪数据集的训练,包括 RAVDESS、CREMA-D、SAVEE、TESS 和电影片段。
  • 特征提取方法包括梅尔频率倒谱系数、过零率、均方根以及多种数据增强算法。
  • 该模型能够以63%的不加权准确率识别语音信号中的情绪状态,展示了出色的效率。
➡️

继续阅读