小红花·文摘

本研究提出了一种异构双模态注意力融合框架（HBAF），旨在解决多模态情感识别中的模态差距问题。通过引入上下文信息和动态双模态注意力，HBAF提高了音频与文本的融合效率和交互能力。实验结果表明，该方法在MELD和IEMOCAP数据集上优于现有基线。