融合声学和基于文本特征的情感识别的方法
原文中文,约400字,阅读约需1分钟。发表于: 。使用声学和文本特征,研究通过不同方法对语言情感进行分类的研究。使用 BERT 获取情感转录中所包含信息的上下文化词嵌入,相比使用 Glove 嵌入,结果表明表现更好。我们还提出并比较不同的音频和文本模式结合策略,并在 IEMOCAP 和 MSP-PODCAST 数据集上进行评估。我们发现,在这两个数据集上,融合声学和文本系统是有益的,尽管在评估的融合方法中只观察到微小的差异。最后,对于...
该研究使用声学和文本特征对语言情感进行分类。使用BERT获取情感转录中的上下文化词嵌入,结果比使用Glove嵌入更好。融合声学和文本系统对于分类有益。交叉验证折叠的标准方法对结果有巨大影响,先前的作品可能夸大了结合转录的优势。