GraphVL:通过视觉-语言模型进行图增强的语义建模以实现广义类别发现

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新模型GraphVL,结合图卷积网络与CLIP文本编码器,旨在解决广义类别发现中的特征转移问题,提升对未知类别的分类能力,并在七个数据集上取得了优异表现。

🎯

关键要点

  • 本研究提出了一种新模型GraphVL,结合图卷积网络与CLIP文本编码器。
  • GraphVL旨在解决广义类别发现中的特征转移问题。
  • 该模型提升了对未知类别的分类能力。
  • GraphVL在七个数据集上取得了优异表现。
  • 研究表明,GraphVL能够有效调节语义空间,保持类别邻域结构。
➡️

继续阅读