本研究提出了高质量的远程感知视觉语言模型数据集DDFAV,并研发了RSPOPE评估方法,以解决LVLMs在远程感知任务中的表现不足和数据集不足的问题。
本文综述了远程感知领域中视觉语言模型的最新进展,重点介绍了MarineGPT、SkyEyeGPT和EarthGPT等多模态模型在船只检测和分类任务中的应用。这些模型通过构建多模态语义空间和利用新技术,显著提升了遥感图像的理解和分类准确性,为未来研究提供了重要的数据和方法。
本文提出了一种基于Transformer的DUET方法,通过自我监督的多模态学习实现零样本学习,展示了在远程感知场景分类中的优越性,能够自动发现显著区域并学习辨别性语义表征,性能显著优于现有算法。
北极永久冻土面临重大变化,远程感知在了解北极过程中起关键作用。研究侧重于远程检测退化性融沉积(RTS),使用半监督学习方法训练语义分割模型以检测RTS。实验证明,该方法能提高模型性能,具有很好的推广潜力。
该文介绍了一种自相关和交叉相关学习网络,用于少样本远程感知图像语义分割。该模型通过考虑支持图像和查询图像之间的自相关和交叉相关来增强泛化性能。
本研究构建了一个高质量的远程感知图像字幕数据集(RSICap),包括 2,585 个人工注释的字幕,为每个图像提供了详细的描述,包括场景描述和对象信息。此外,还提供了一个基准评估数据集 RSIEval,可以全面评估在 RS 背景下的视觉语言模型。
完成下面两步后,将自动完成登录并继续当前操作。