基于 LLM 的改进和基于框的分割的地面多模态命名实体识别的推进
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的多模态端到端框架MNER-QG,可同时进行命名实体识别和查询接地任务,并通过查询提供先验知识,增强文本和图像表征。实验结果显示,MNER-QG在MNER任务上优于当前最先进的模型,并提高了查询接地性能。
🎯
关键要点
- 提出了一种新颖的端到端框架 MNER-QG。
- MNER-QG 同时执行基于 MRC 的多模态命名实体识别和查询接地任务。
- 通过查询提供识别实体类型和视觉区域的先验知识。
- 增强了文本和图像的表征。
- 在 Twitter2015 和 Twitter2017 上进行了广泛的实验。
- 实验结果表明 MNER-QG 在 MNER 任务上优于当前最先进的模型。
- MNER-QG 提高了查询接地性能。
➡️