无训练的零样本组合图像检索和本地概念重新排序

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种新的基于零样本训练的无需训练的组合图像检索方法(TFCIR),通过将查询翻译成易于理解的文本,提高计算效率并保持模型的泛化性。实验证明该方法在多个基准测试上实现了与最先进方法相当的性能,并明显优于其他无需训练的方法。

🎯

关键要点

  • 提出了一种新的基于零样本训练的组合图像检索方法 (TFCIR)。

  • 通过将查询翻译成易于理解的文本,提高计算效率并保持模型的泛化性。

  • 引入局部概念再排序机制 (LCR),聚焦于提取有区别的局部信息。

  • 在三个 ZS-CIR 基准测试上进行大量实验,验证了该方法的有效性。

  • 在开放领域数据集 CIRR、CIRCO 以及时尚领域数据集 FashionIQ 上表现出与最先进方法相当的性能。

  • 明显优于其他无需训练的方法。

➡️

继续阅读