PVLR:基于提示的视觉语言表示学习用于多标签图像识别
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
最近的研究发现,视觉语言学习在人物再识别方面具有潜力。一种名为π-VL的方法通过在ReID任务中利用部分信息语言监督来增强视觉特征,取得了显著改进,尤其在MSMT17数据库中达到了90.3%的Rank-1和76.5%的mAP。
🎯
关键要点
- 视觉语言学习在人物再识别方面展示了巨大的潜力。
- 提出了一种名为Part-Informed Visual-language Learning (π-VL)的方法。
- 该方法通过部分信息语言监督增强细粒度的视觉特征。
- 在四个常用的ReID基准测试中取得显著改进。
- 在MSMT17数据库中达到了90.3%的Rank-1和76.5%的mAP。
- 该方法无需任何额外的技术手段。
➡️