本研究提出了LapGSR模型,旨在解决低分辨率图像在多模态数据融合中的视觉质量问题。该模型通过拉普拉斯金字塔提取边缘信息,降低计算负担,同时保持图像细节。实验结果表明,LapGSR在ULB17-VT和VGTSR数据集上表现优异,且参数数量显著少于其他模型。
本文综述了RGB-DT多模态数据融合的研究进展,探讨了校准、热成像、三维重建及深度学习算法等技术。提出了一种利用RGB相机实时探测野火的方法,并应用于无人机,研究表明结合计算方法与人类视觉能更好地识别隐藏物体。此外,介绍了多个数据集,以提升自动驾驶和森林监测的感知能力。
本研究提出了高动态范围神经辐射场(HDR-NeRF)和HDR-Plenoxels方法,旨在从低动态范围图像生成高质量HDR图像。实验结果表明,这些方法在曝光控制和图像质量方面表现优异,同时探讨了多模态数据融合和动态HDR NeRF框架,推动了相关领域的发展。
该研究提出了一种新的RGB-T目标跟踪方法及基准数据集,探讨了多模态数据融合的有效性。通过视觉关注机制和动态模态感知滤波器,解决了遮挡和快速运动问题。研究还设计了轻量级即时学习器和新型跟踪框架,展示了在多个基准上的优越性能,推动了RGB-T跟踪领域的发展。
本文提出了一种新型方法,利用先进的3D视觉编码器和自回归变换器生成胸部CT影像的放射学报告。研究回顾了自动生成放射学报告的技术进展,强调深度学习和多模态数据融合的重要性,并介绍了临床质量强化学习策略。实验结果显示,该方法在报告生成的质量和准确性上具有显著优势,为未来研究提供了新方向。
本文提出了一种轻量级模型解决多模态数据融合问题的方法,通过层级交叉模态变压器与模态门控实现。在三个基准数据集上验证了该方法的有效性,模型参数数量不到100万个,表现出具有竞争力的结果。
本文提出了一个有效的框架,用于对高分辨率光学卫星图像中的个别建筑物进行语义解释。通过领域自适应预训练策略、复合双支干、新的数据增强流程、随机权重平均训练和基于实例分割的模型集成,实现了额外的性能提升。此外,还探讨了光学卫星图像和SAR数据的多模态数据融合潜力。
完成下面两步后,将自动完成登录并继续当前操作。