GraphVL: Graph-Enhanced Semantic Modeling via Vision-Language Models for Generalized Class Discovery

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了GraphVL模型,结合图卷积网络和CLIP文本编码器,旨在解决广义类别发现中的特征转移问题。GraphVL有效提升了对未知类别的分类能力,并在多个基准数据集上表现出显著优势。

🎯

关键要点

  • GraphVL模型结合了图卷积网络和CLIP文本编码器,旨在解决广义类别发现中的特征转移问题。
  • GraphVL能够有效调节语义空间,提升对未知类别的分类能力。
  • 在七个基准数据集上,GraphVL展现出显著的性能优势。
➡️

继续阅读