语言驱动的视觉概念学习

💡 原文约300字/词,阅读约需1分钟。
📝

内容提要

ConceptX框架利用聚类发现预训练语言模型中的潜在概念,并与人类定义的概念对齐解释。学习表示中的潜在空间与不同语言概念有不同程度的重叠,较低层主要表示词汇概念,而核心语言概念在中高层更好地表示。部分编码的概念具有多面性,无法用现有的人类定义概念充分说明。