AMNS:基于注意力加权的选择性掩膜和噪声标签抑制用于文本到图像的人物检索

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文提出了一个基于图像标注数据有限的半监督框架,包括生成阶段和检索阶段。实验结果表明,该框架在半监督设置下取得了可观的性能。

🎯

关键要点

  • 该论文提出了一个基于图像标注数据有限的半监督框架。
  • 框架包括生成阶段和检索阶段。
  • 生成阶段利用图像字幕模型为未标注图片生成伪文本。
  • 检索阶段使用增广数据进行完全监督的检索学习。
  • 引入噪声干扰的伪文本框架,增强检索模型处理噪声数据的能力。
  • 框架结合混合Patch-Channel掩蔽和噪声引导渐进式训练两个关键策略。
  • 渐进式训练进程根据伪文本的噪声水平引入,以防止过度拟合噪声监督。
  • 在多个TBPS基准测试上的实验表明,该框架在半监督设置下取得了可观的性能。
➡️

继续阅读