RankCLIP: 语言 - 图像一致的排序预训练

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

RankCLIP是一种扩展CLIP的模型,通过自我监督的对比学习和排序一致性来提高对齐过程,提升下游任务性能,特别是零样本分类。它展示了视觉语言预训练的潜力。

🎯

关键要点

  • RankCLIP是一种扩展CLIP的模型。

  • 通过自我监督的对比学习和排序一致性来提高对齐过程。

  • RankCLIP提升了下游任务的性能,特别是在零样本分类方面。

  • 该模型展示了视觉语言预训练的潜力。

  • RankCLIP捕捉模态之间和内部的多对多关系。

➡️

继续阅读