本文提出了一种多模式表示学习框架(MRLF),用于融合社交帖子中的不同模态信息进行位置推断,实验结果显示位置预测准确。此外,研究了多模态融合方法,识别社交媒体中视频与文本标题的语义不一致,分类准确率达到60.5%。还探讨了假新闻检测和图像-文本检索等多模态任务,提出多种新方法,在多个数据集上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。