超越标签:揭示语音情感识别数据集中的文本依赖性
原文中文,约400字,阅读约需1分钟。发表于: 。通过检查专门数据集中的词汇重叠和机器学习模型的性能,我们揭示了特质标签中的显著文本依赖性,结果表明一些机器学习模型可能过多关注词汇特征而不是目标的语音特征,研究呼吁研究界重新评估现有数据集和方法论的可靠性,确保机器学习模型真正学到其设计的内容。
大型语言模型ParalinGPT利用文本和语音模态来建模口语回应的语言内容和语用属性,实验结果表明其在情感分类和回应文本生成方面优于典型的序列分类技术,相对改进分别为6.7%、12.0%和3.5%。