本文提出了AerialVG任务,专注于航空视角的视觉定位,解决了相似对象区分和空间关系强调的问题。引入了包含5000张航空图像的AerialVG数据集,并提出了一种新模型,实验结果验证了其有效性。
本研究提出了一种新算法,用于从航空或卫星图像中检测道路网络。该算法结合了图像分解、格式塔理论对齐检测和统计活动轮廓处理,显著提高了检测的准确性和效率。
本文提出了一种新颖的几何保留地面到航空图像合成模型(GPG2A),能够生成真实的航空图像并保留几何特征。研究验证了GPG2A在数据增强和基于草图的区域搜索中的有效性。
本论文介绍了一种创新的道路网络生成方法,使用多模式大型语言模型处理航空图像的道路布局,并生成详细的可导航道路网络。模型通过独特的训练方法创造了道路网络,实验证明了在提供精确和有价值的导航指引方面的有效性。
本文提出了一种新的框架来解决航空图像到地面图像合成的挑战,通过结构对齐和语义感知的方法实现了复杂地理结构的重建,并通过引入预训练分割网络实现了跨类别综合样式的生成。该方法在质量和数量上显示出了有效性。
SAM是一种基础模型,可基于输入提示在图像中分割对象。研究表明,SAM在零样本图像分割准确性方面表现良好。然而,在航空图像问题中,SAM可能失败。
该论文介绍了一种使用多模式大型语言模型处理航空图像的道路布局,并生成详细可导航道路网络的方法。该模型采用了BLIP-2架构和预训练的冻结图像编码器和大型语言模型相结合的方法,证明了其在提供精确和有价值的导航指引方面的有效性。
SAM是一种基于便宜的输入提示的视觉任务基础模型,可用于图像分割。在大量基准测试中表现良好,但在航空图像问题中可能会失败。
研究开发了基于便宜的输入提示的Segment Anything Model(SAM),可在输入的图像中分割对象。SAM在大量基准任务中研究,发现其零样本图像分割准确性通常与训练的视觉模型类似。但在航空图像问题中,由于独特特征,SAM在某些情况下会失败。
SAM是一种基础模型,可基于输入提示在图像中分割对象,其零样本图像分割准确性通常与训练过的视觉模型类似或超过。SAM在多样化、广泛研究的基准任务集上表现良好,但在航空图像问题中,有时会失败。
本文研究了利用浅层模型评估 LiDAR 数据在建筑分割中的应用。通过边界掩模提升边界一致性得分,结合航空图像和 LiDAR 数据进行模型的训练与比较。结果表明浅层模型在航空图像任务和航空图像与 LiDAR 数据任务下的得分分别优于深度学习模型 8% 和 2%。深度学习模型在 Boundary Intersection over Union 得分方面表现更好,采用 LightGBM 的效果优于 RF 和 XGBoost。
完成下面两步后,将自动完成登录并继续当前操作。