句级提示有利于复合图像检索
原文中文,约400字,阅读约需1分钟。发表于: 。通过学习适当的句子级提示(SPRC),我们提出了一种有效的组合图像检索方法,该方法使用句子级提示与相关说明相结合,并利用图像 - 文本对比损失和文本提示对齐损失来增强检索性能。我们的实验证明,该方法在 Fashion-IQ 数据集上表现优越。
本文介绍了一种名为Context-I2W的新型上下文依赖映射网络,用于实现准确的零样本组合图像检索任务。该模型通过动态学习旋转规则将相同的图像映射到特定任务的操作视图,并在多个可学习查询的指导下进一步捕获涵盖ZS-CIR任务中主要目标的局部信息,从而实现将图像映射到上下文依赖的伪词标记。该模型在四个ZS-CIR任务上表现出很强的泛化能力,并取得了新的最先进结果。