HyCIR: 利用合成标签增强零样本组合图像检索
原文中文,约400字,阅读约需1分钟。发表于: 。本文提出了一种使用合成标签来提升零样本图像检索性能的混合检索方法(HyCIR),使用了合成 CIR 三元组和对比学习两种策略,实现了在 CIRR 和 CIRCO 等常见图像检索基准中的零样本任务的最新性能。
本文介绍了一种名为Zero-Shot CIR(ZS-CIR)的新任务,该任务不需要有标签的训练数据集。作者提出了一种名为iSEARLE的方法,将参考图像的视觉信息映射到CLIP标记嵌入空间的伪词标记中,并与相关说明结合。作者还提供了一个名为CIRCO的开放领域基准数据集,实验结果表明iSEARLE在多个CIR数据集上获得了最先进的性能。