渐进特征挖掘与外部知识辅助的文本行人图像检索
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种新的视觉文本关联方法,利用视觉和文本注意力以及交叉模态最难和半硬负对挖掘。在实验中,该方法在CUHK-PEDES数据集上取得了55.32%的top1得分,成为了最先进的方法。同时,在COCO字幕数据集上验证了半硬匹配挖掘方法的有效性和互补性。
🎯
关键要点
-
提出了一种新的视觉文本关联方法
-
该方法利用视觉和文本注意力以及交叉模态最难和半硬负对挖掘
-
在CUHK-PEDES数据集上取得了55.32%的top1得分
-
成为了最先进的方法
-
在COCO字幕数据集上验证了半硬匹配挖掘方法的有效性和互补性
➡️