本研究提出了一种异构双模态注意力融合框架(HBAF),旨在解决多模态情感识别中的模态差距问题。通过引入上下文信息和动态双模态注意力,HBAF提高了音频与文本的融合效率和交互能力。实验结果表明,该方法在MELD和IEMOCAP数据集上优于现有基线。
本文提出了一种新颖的深度感知注意力融合网络,通过特定编码器提取色彩和深度信息,并引入深度加权交叉注意力融合模块,动态调整特征图融合权重。实验结果表明,该方法在伪装物体检测中显著优于其他方法,验证了深度信息的重要性。
完成下面两步后,将自动完成登录并继续当前操作。