本文探讨了语音情感识别(SER)模型的潜力,强调自然对话语料库的重要性。研究团队使用Switchboard语料库,训练了众包标注的情感(如愤怒、快乐等)和维度属性(如激活度、效价)。结果显示模型在不同情感类别上的表现差异,尤其愤怒情感的泛化能力较差。研究强调使用自然情感变化数据集进行评估的重要性,并发布了SWB-Affect标签以促进进一步分析。
本研究提出了一种利用对话上下文信息提升语音识别性能的模型,在Switchboard语料库上的测试优于传统方法。
完成下面两步后,将自动完成登录并继续当前操作。