面向零样本基于草图的图像检索的模态感知表示学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新颖的零样本学习框架,通过对比文本间接对齐素描和照片,避免了对素描照片成对样本的需求。该方法通过学习明确的形态编码,实现了跨模态内容检索。实验证明该模型在零样本基于素描的图像检索上有效,并可应用于广义和细粒度设置。

🎯

关键要点

  • 零样本学习为处理未见类别提供有效解决方案,避免繁琐数据收集。

  • 提出了一种新颖的框架,通过对比文本间接对齐素描和照片,避免对成对样本的需求。

  • 通过学习明确的形态编码,将形态不可知的语义与形态特定信息分解。

  • 实现了跨模态内容检索,桥接了形态间的差距。

  • 实验验证了模型在零样本基于素描的图像检索上的有效性,适用于广义和细粒度设置。

➡️

继续阅读