小红花·文摘

本文提出了一种多模式表示学习框架（MRLF），用于融合社交帖子中的不同模态信息进行位置推断，实验结果显示位置预测准确。此外，研究了多模态融合方法，识别社交媒体中视频与文本标题的语义不一致，分类准确率达到60.5%。还探讨了假新闻检测和图像-文本检索等多模态任务，提出多种新方法，在多个数据集上表现优异。