CLIP多模态哈希用于多媒体检索

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的CLIP多模态哈希方法(CLIPMH),通过CLIP框架融合文本和视觉特征生成哈希码,提升多模态检索性能,mAP提高8.38%。

🎯

关键要点

  • 本研究提出了一种新的CLIP多模态哈希方法(CLIPMH)。
  • CLIPMH旨在解决现有多模态哈希方法在特征表达能力和大规模无监督多模态数据预训练上的不足。
  • 该方法通过CLIP框架提取文本和视觉特征并融合生成哈希码。
  • CLIPMH显著提高了多模态检索性能。
  • 实验结果显示,CLIPMH在mAP上最高可提高8.38%。
➡️

继续阅读