本文提出了AerialVG任务,专注于航空视角的视觉定位,解决了相似对象区分和空间关系强调的问题。引入了包含5000张航空图像的AerialVG数据集,并提出了一种新模型,实验结果验证了其有效性。
本研究提出了一种新算法,用于从航空或卫星图像中检测道路网络。该算法结合了图像分解、格式塔理论对齐检测和统计活动轮廓处理,显著提高了检测的准确性和效率。
本文介绍了一种基于方向信息的神经网络模型,应用于图像地理定位,通过角度编码提高特征提取的准确性。研究探讨了街景图像与航空图像的匹配问题,提出了新的方法来估计未知对齐信息,展示了在低重叠情况下的鲁棒性和高效性。
本文提出了一种新型半监督定向目标检测模型,解决航空图像中的尺度不平衡问题,采用适应性阈值和教师引导等技术,提升检测性能。实验结果表明,该方法在DOTA-v1.5基准测试中优于现有技术,展示了半监督目标检测的最新进展。
本文介绍了一种新的交叉视图特征传输技术,旨在提高地面图像与航空图像之间的功能对齐和定位精度。通过自监督学习和动态相似度匹配网络,研究了多种训练策略,显著提升了视觉地理定位的性能和效率,尤其在复杂场景中实现了高精度定位。
SAM是一种基础模型,可基于输入提示在图像中分割对象。研究表明,SAM在零样本图像分割准确性方面表现良好。然而,在航空图像问题中,SAM可能失败。
该论文介绍了一种使用多模式大型语言模型处理航空图像的道路布局,并生成详细可导航道路网络的方法。该模型采用了BLIP-2架构和预训练的冻结图像编码器和大型语言模型相结合的方法,证明了其在提供精确和有价值的导航指引方面的有效性。
SAM是一种基于便宜的输入提示的视觉任务基础模型,可用于图像分割。在大量基准测试中表现良好,但在航空图像问题中可能会失败。
研究开发了基于便宜的输入提示的Segment Anything Model(SAM),可在输入的图像中分割对象。SAM在大量基准任务中研究,发现其零样本图像分割准确性通常与训练的视觉模型类似。但在航空图像问题中,由于独特特征,SAM在某些情况下会失败。
SAM是一种基础模型,可基于输入提示在图像中分割对象,其零样本图像分割准确性通常与训练过的视觉模型类似或超过。SAM在多样化、广泛研究的基准任务集上表现良好,但在航空图像问题中,有时会失败。
本文研究了利用浅层模型评估 LiDAR 数据在建筑分割中的应用。通过边界掩模提升边界一致性得分,结合航空图像和 LiDAR 数据进行模型的训练与比较。结果表明浅层模型在航空图像任务和航空图像与 LiDAR 数据任务下的得分分别优于深度学习模型 8% 和 2%。深度学习模型在 Boundary Intersection over Union 得分方面表现更好,采用 LightGBM 的效果优于 RF 和 XGBoost。
完成下面两步后,将自动完成登录并继续当前操作。