本研究提出了一种基于CLIP引导的对比学习架构,用于多模态特征对齐。实验结果显示该模型在多模态讽刺检测和情感分析任务中优于基准模型,且无需外部知识,易于迁移到其他多模态任务。
该论文提出了一种全局到局部的方法来解决 RGB 和深度数据之间的差距以及多模态特征对齐的不足。实验证明该方法有效,能够显著减小领域转移并获得令人满意的结果。
完成下面两步后,将自动完成登录并继续当前操作。