大规模语言模型推动了人工智能的发展,尤其在远程感知领域。研究团队构建了高质量的图像字幕数据集RSICap,包含2,585个详细注释,促进了视觉语言模型的训练与评估。
本研究提出了高质量的远程感知视觉语言模型数据集DDFAV,并研发了RSPOPE评估方法,以解决LVLMs在远程感知任务中的表现不足和数据集不足的问题。
本研究提出Loris系统,结合可见光与红外摄像机,增强纳米卫星在恶劣空间条件下的能力,以满足关键任务需求并提升数据处理能力,支持远程感知应用。
远程感知中,立体匹配和真实数据不足限制了深度神经网络的训练。合成图像存在域泛化问题。提出一种结合图像翻译和立体匹配的边缘感知生成对抗网络,利用Sobel算子获取边缘图像,保持几何和立体一致性。结果显示,该模型在多个领域表现优于现有模型。
大规模语言模型推动人工智能发展,远程感知领域对视觉语言模型感兴趣。研究构建高质量远程感知图像字幕数据集,促进视觉语言模型发展。提供基准评估数据集,全面评估远程感知背景下的视觉语言模型。
北极永久冻土面临重大变化,远程感知在了解北极过程中起关键作用。研究侧重于远程检测退化性融沉积(RTS),使用半监督学习方法训练语义分割模型以检测RTS。实验证明,该方法能提高模型性能,具有很好的推广潜力。
该文介绍了一种自相关和交叉相关学习网络,用于少样本远程感知图像语义分割。该模型通过考虑支持图像和查询图像之间的自相关和交叉相关来增强泛化性能。
本研究构建了一个高质量的远程感知图像字幕数据集(RSICap),包括 2,585 个人工注释的字幕,为每个图像提供了详细的描述,包括场景描述和对象信息。此外,还提供了一个基准评估数据集 RSIEval,可以全面评估在 RS 背景下的视觉语言模型。
完成下面两步后,将自动完成登录并继续当前操作。