CPCL:跨模态原型对比学习弱监督的基于文本的人员再识别
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
這項研究旨在通過使用原型對比學習(PCL)損失微調視覺語言模型CLIP的圖像編碼器,提升物體再識別表現。實驗結果證明了該方法在人物和車輛再識別上的競爭力,並在無監督場景中取得了最新的表現。
🎯
关键要点
- 研究旨在提升物體再識別(Re-ID)表現,使用大規模預先訓練的視覺語言模型CLIP。
- 分析了CLIP-ReID中prompt learning的作用並確認其限制。
- 提出了一種使用原型對比學習(PCL)損失微調CLIP圖像編碼器的方法,消除了對prompt learning的需求。
- 實驗結果顯示該方法在人物和車輛Re-ID數據集上具有競爭力。
- 基於PCL的CLIP微調方法在無監督場景中達到了最新的表現。
➡️