该研究推出了名为MESSI的多高度语义分割图像数据集,包含2525幅无人机拍摄的城市图像,旨在解决数据不足问题并提供标准化评估基准。
本文提出了一种基于知识图谱和知识注入对比学习的模型,显著提升了城市图像的表征学习和预测精度。研究还探讨了无监督概念学习和自我解释深度学习模型在多个数据集上的优越表现,强调了可解释性和概念发现的重要性。
完成下面两步后,将自动完成登录并继续当前操作。