面向零样本基于草图的图像检索的模态感知表示学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新颖的零样本学习框架,通过对比文本间接对齐素描和照片,避免了对素描照片成对样本的需求。该方法通过学习明确的形态编码,实现了跨模态内容检索。实验证明该模型在零样本基于素描的图像检索上有效,并可应用于广义和细粒度设置。
🎯
关键要点
-
零样本学习为处理未见类别提供有效解决方案,避免繁琐数据收集。
-
提出了一种新颖的框架,通过对比文本间接对齐素描和照片,避免对成对样本的需求。
-
通过学习明确的形态编码,将形态不可知的语义与形态特定信息分解。
-
实现了跨模态内容检索,桥接了形态间的差距。
-
实验验证了模型在零样本基于素描的图像检索上的有效性,适用于广义和细粒度设置。
➡️