本文介绍了一种新方法,通过多模态信息融合实现零样本组合图像检索(CIR),在CIRR和FashionIQ等数据集上表现优异。提出的SEARLE和LinCIR方法无需标记数据,利用视觉特征和文本描述提高检索准确性,实验结果显示这些方法在多个基准测试中超越了现有技术,展现出良好的泛化性能。
本文介绍了一种新型的零样本组合图像检索方法Zero-Shot CIR,结合视觉特征和文本描述,提出了SEARLE方法及CIRCO数据集。实验结果表明,SEARLE在多个基准上优于传统方法,LinCIR和其他新方法在检索准确性和效率上也有显著提升。
完成下面两步后,将自动完成登录并继续当前操作。