WavFusion:迈向wav2vec 2.0多模态语音情感识别

📝

内容提要

本研究针对语音情感识别中的多模态融合问题,提出了WavFusion框架,重点解决跨模态交互的复杂性及模态间的异质性。通过引入门控跨模态注意机制和多模态同质特征差异学习,WavFusion在基准数据集上表现优于现有的最先进方法,突出精确捕捉跨模态交互的重要性。

🏷️

标签

➡️

继续阅读