RankCLIP: 语言 - 图像一致的排序预训练
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
RankCLIP是一种扩展CLIP的模型,通过自我监督的对比学习和排序一致性来提高对齐过程,提升下游任务性能,特别是零样本分类。它展示了视觉语言预训练的潜力。
🎯
关键要点
-
RankCLIP是一种扩展CLIP的模型。
-
通过自我监督的对比学习和排序一致性来提高对齐过程。
-
RankCLIP提升了下游任务的性能,特别是在零样本分类方面。
-
该模型展示了视觉语言预训练的潜力。
-
RankCLIP捕捉模态之间和内部的多对多关系。
➡️