基于变压器模型的CMU-MOSEI数据集多模态情感分析

📝

内容提要

本研究针对多模态情感分析中的不足,采用基于变压器的模型通过早期融合整合文本、音频和视觉信息。研究结果显示,该模型在测试集上实现了97.87%的七分类准确率和0.9682的F1分数,展示了早期融合在跨模态交互捕捉方面的有效性。

🏷️

标签

➡️

继续阅读