小红花·文摘

图像地理定位新突破！缅因大学/谷歌/OpenAI等提出LocDiff框架，实现无需网格与参考库的全球级精准定位

HyperAI超神经 ·

本研究提出了一种新方法LocDiffusion，通过扩散机制解决图像地理定位中的空间分布不一致问题。该方法采用球面位置编码-解码框架，显著增强了未见位置的泛化能力，并在基准测试中表现出竞争力。

LocDiffusion：通过在希尔伯特空间中扩散识别地球上的位置

BriefGPT - AI 论文速递 ·

GAEA是一种针对图像地理定位的对话模型，旨在解决信息交流缺失的问题。该模型基于80万张图像和160万问答对的数据集，展现了卓越的对话能力，显著超越现有模型，具有广泛的应用潜力。

GAEA: A Geolocation-Aware Conversational Model

BriefGPT - AI 论文速递 ·

本文提出了一种结合联邦学习与跨视角图像地理定位的方法，旨在解决自主驾驶中的数据隐私和异构性问题。该方法通过共享粗特征提取器，保持本地细粒度特征，降低通信开销，保护数据隐私。

个性化联邦学习用于跨视角地理定位

BriefGPT - AI 论文速递 ·

使用Gemini进行地理定位的乐趣

DEV Community ·

中国科学院自动化所和阿里云合作推出街景定位大模型AddressCLIP，通过一张照片实现街道级精度的定位。该模型基于CLIP构建，通过数据集构建和模型训练实现图像地理定位任务。AddressCLIP在定量和定性实验中表现优于其他方法。未来可应用于社交媒体个性化推荐和地理信息问答。

一张图实现街道级定位，端到端图像地理定位大模型AddressCLIP登ECCV2024

量子位 ·

本文介绍了一种基于方向信息的神经网络模型，应用于图像地理定位，通过角度编码提高特征提取的准确性。研究探讨了街景图像与航空图像的匹配问题，提出了新的方法来估计未知对齐信息，展示了在低重叠情况下的鲁棒性和高效性。

去耦合技术在地图配准问题中的应用

BriefGPT - AI 论文速递 ·

本文介绍了多种基于神经网络的图像地理定位方法，包括方向信息、条件GAN和动态相似度匹配网络，提升了定位准确性和特征提取能力。此外，研究提出了新型可训练检索体系结构和跨视图生成方法，显著改善了复杂场景中的性能。

跨视角与扩散相遇：具几何和文本引导的航空图像合成

BriefGPT - AI 论文速递 ·

本文研究了基于图像的地理定位问题，提出了一种新的方法。该方法通过在地图上确定地面视角的查询图像，并利用2.5D空间中的结构高度来引导跨视图匹配。同时，借助多模态数据学习代表性嵌入。通过构建大规模的地面到2.5D地图地理定位数据集来验证方法，并在单图像定位和路径定位等任务上进行了广泛实验。结果表明，该方法在定位精度和收敛速度上明显优于之前的基于2D地图的方法。

基于图像的地理定位通过地面到 2.5D 地图匹配

BriefGPT - AI 论文速递 ·