该研究提出了KAN-MCP框架,旨在解决多模态情感分析中的可解释性和模态不平衡问题。该框架结合了KAN的可解释性与MCPareto的鲁棒性,通过降维和去噪来提升模型性能。
本研究提出动态调制方法解决多模态学习中的模态不平衡问题,通过动态预测和梯度调制提升任务性能,验证了其有效性和灵活性。
本研究使用多模态大型语言模型 (MLLM) 生成视频的文本描述,减少模态不平衡并提高时间定位准确性。通过时间对齐和特征融合,生成语义增强的视频表示序列用于查询定位。实验证明该方法有效。
完成下面两步后,将自动完成登录并继续当前操作。