本文介绍了一种名为MultiModal Contrastive Learning (MMCL)的新框架,用于捕捉多模态表示中的内部和外部动态。采用对比学习技术,包括单模态对比编码和伪孪生网络,来过滤噪声和捕获跨模态动态。实验结果表明,该方法超过了现有的最先进方法。
完成下面两步后,将自动完成登录并继续当前操作。