基于高效通道注意力引导的深度CNN-BiLSTM框架增强语音情感识别

📝

内容提要

本研究针对语音情感识别中如何在较低计算成本下选择相关特征表示的挑战,提出了一种轻量化的SER架构,结合了基于注意力的局部特征块和全局特征块技术以有效提取语音信号中的情感特征。通过在多语种基准数据集上的5折交叉验证,该模型达到99.65%的平均准确率,显示出在现有方法中具有领先的表现。

🏷️

标签

➡️

继续阅读