本论文介绍了为SemEval-2024任务3开发的多模态情绪原因分析系统,通过集成文本、音频和视频等多种模态,有效捕捉人际对话中的情绪。系统采用两种不同的方法,获得第四名,并证明提出的解决方案有显著性能提升。实验代码可在GitHub上找到。
本论文介绍了为SemEval-2024任务3开发的多模态情绪原因分析系统,通过集成文本、音频和视频等多种模态来捕捉人际对话中的情绪。系统采用Llama 2模型和GPT-4V、GPT 3.5进行情绪和原因预测、基于对话的视频描述和上下文学习。在比赛中获得第四名,实验证明该解决方案性能显著提升。
完成下面两步后,将自动完成登录并继续当前操作。