有效的预处理方法与基于CNN的具有高效通道注意力的语音情感识别架构研究
发表于: 。本研究解决了语音情感识别(SER)中数据不足导致的过拟合问题,通过八种具有不同频率-时间分辨率的数据集版本,寻找有效的情感语音预处理方法。提出的六层卷积神经网络(CNN)模型结合有效通道注意力(ECA),显著增强了通道特征表示,从而在识别性能上超过了之前的SER模型,提供了更为高效的架构解决方案。
本研究解决了语音情感识别(SER)中数据不足导致的过拟合问题,通过八种具有不同频率-时间分辨率的数据集版本,寻找有效的情感语音预处理方法。提出的六层卷积神经网络(CNN)模型结合有效通道注意力(ECA),显著增强了通道特征表示,从而在识别性能上超过了之前的SER模型,提供了更为高效的架构解决方案。