Enhancing Speech Emotion Recognition through Segmental Average Pooling of Self-Supervised Learning Features
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种分段平均池化(SAP)方法,旨在解决语音情感识别中非语音段导致的特征信息稀释问题。通过选择性关注语音段,该方法显著提升了英语和韩语数据集上的识别性能。
🎯
关键要点
-
本研究提出了一种分段平均池化(SAP)方法,旨在解决语音情感识别中非语音段导致的特征信息稀释问题。
-
该方法通过选择性关注语音段,显著提升了语音情感识别的性能。
-
实验结果表明,分段平均池化方法在英语和韩语数据集上均达到了最佳效果。
🏷️