本研究提出了一种名为SE-KGE的位置感知知识图嵌入模型,用于处理空间信息。模型在地理逻辑查询回答任务上优于多个基线,并引入了一种称为空间语义提升的新型下游任务。
该文介绍了DualToken-ViT视觉变换模型,它融合局部和全局信息,使用位置感知的全局标记来丰富全局信息,改进了图像的位置信息。在图像分类、物体检测和语义分割任务上进行广泛实验,展示了DualToken-ViT的有效性。
完成下面两步后,将自动完成登录并继续当前操作。