本研究提出了一种异构双模态注意力融合框架(HBAF),旨在解决多模态情感识别中的模态差距问题。通过引入上下文信息和动态双模态注意力,HBAF提高了音频与文本的融合效率和交互能力。实验结果表明,该方法在MELD和IEMOCAP数据集上优于现有基线。
完成下面两步后,将自动完成登录并继续当前操作。