本研究提出了一种新颖的RGB和短波红外(SWIR)多光谱驾驶数据集(RASMD),包含10万个同步的RGB-SWIR图像对。研究表明,结合RGB和SWIR数据能显著提高恶劣天气条件下的检测精度,为自主驾驶和稳健感知系统提供了新动力。
本研究提出Llama3-MS-CLIP模型,通过对大规模多光谱数据集进行对比学习预训练,显著提升了多光谱图像的分类和检索能力,强调了多光谱视觉语言学习的重要性。
本文探讨了多种基于遮蔽自编码器(MAE)的遥感图像自监督学习方法,如SatMAE、SS-MAE和Cross-Scale MAE,展示了它们在多光谱和高光谱数据分类中的优越性。研究表明,这些方法通过改进的预训练框架和多模态数据融合,显著提升了遥感图像的分类和重建性能。
本研究提出了MBNet多光谱行人检测模型,利用多模态融合技术在KAIST和CVC-14数据集上实现了优异的检测性能,尤其在恶劣光照条件下表现突出,并显著提高了行人检测的准确性。
本文提出了一种基于变分的方法融合高光谱和多光谱图像,设计了稀疏正则化项,仿真结果显示其效率优于现有方法。同时,介绍了平行因子分解的信道估计方法和基于深度神经网络的非线性模型,均在各自领域展现出优势。
本文介绍了一种基于变压器的多光谱神经图像压缩器,利用自注意力机制提升压缩性能,研究表明该方法在多个波长上优于传统算法,尤其在低比特率下表现出色,适用于NASA的数据密集型成像任务。
完成下面两步后,将自动完成登录并继续当前操作。