本研究探讨了视觉变换器(ViTs)在对齐分析中使用单一标量值的局限性,并结合对齐分析与概念发现,细化特征空间中的概念。结果表明,增加监督训练可以降低语义结构的关联性。
本文提出了一种基于知识图谱和知识注入对比学习的模型,显著提升了城市图像的表征学习和预测精度。研究还探讨了无监督概念学习和自我解释深度学习模型在多个数据集上的优越表现,强调了可解释性和概念发现的重要性。
完成下面两步后,将自动完成登录并继续当前操作。