本研究提出VP-MEL任务,解决了现有多模态实体链接方法在缺乏提及词时无法有效利用图像和文本信息的问题。通过标记图像特定区域,并利用图像-文本对与知识库中的实体对齐,FBMEL框架在VPWiki数据集上表现优于基线方法。
完成下面两步后,将自动完成登录并继续当前操作。