基于 LLM 的改进和基于框的分割的地面多模态命名实体识别的推进

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新的多模态端到端框架MNER-QG,可同时进行命名实体识别和查询接地任务,并通过查询提供先验知识,增强文本和图像表征。实验结果显示,MNER-QG在MNER任务上优于当前最先进的模型,并提高了查询接地性能。

🎯

关键要点

  • 提出了一种新颖的端到端框架 MNER-QG。
  • MNER-QG 同时执行基于 MRC 的多模态命名实体识别和查询接地任务。
  • 通过查询提供识别实体类型和视觉区域的先验知识。
  • 增强了文本和图像的表征。
  • 在 Twitter2015 和 Twitter2017 上进行了广泛的实验。
  • 实验结果表明 MNER-QG 在 MNER 任务上优于当前最先进的模型。
  • MNER-QG 提高了查询接地性能。
➡️

继续阅读