本文提出了一种新框架LaPIG,利用大语言模型生成高质量的可见光与热成像人脸图像,解决了大规模成对数据集获取的难题。研究表明,LaPIG能够生成多视角图像,提升数据多样性,优于现有方法。
本研究解决了天文学中不同波段星系观测数据之间的转换问题,提出了一种基于生成深度学习的图像到图像模型。该模型不仅能有效插值和外推不同波段的数据,还在真实观测数据的预测中表现出高保真度,展示了生成学习在天文数据集增强与多波段信息探测中的潜在价值。
本研究探讨了可见光-红外人员再识别的多种方法,提出了基于批量归一化的交叉模态神经架构搜索(CM-NAS)和无监督匹配框架,显著提升了跨模态匹配性能。通过模态统一网络和多内存匹配框架,解决了模态差异和类内变异问题,实验结果在多个数据集上优于现有方法。
本研究提出了一种新框架,结合可见光和热成像技术,解决了不良照明条件下的深度估计问题。引入交叉模态特征匹配模块,显著提高了像素级匹配的准确性。
本研究提出了多种新方法以改善可见光-红外行人再识别(Re-ID)性能,包括跨模态特征学习、无监督匹配框架和参数优化策略。实验结果表明,这些方法在标准数据集上优于现有技术,显著提高了识别准确性。
本文介绍了一种基于时间序列的视频人员重识别方法,利用动态时间扭曲模型实现自动对齐和匹配。研究提出了多种框架和数据集,提升了可见光与红外人员重识别的性能,并解决了异构摄像头间的身份关联问题。实验结果表明,该方法在多个数据集上表现优越,为该领域的进一步研究奠定基础。
本研究提出了一种新颖的可见光-红外人员重识别方法,利用模态统一网络(MUN)和转移感知行人关注学习(TMPA)模型,显著提高了识别性能。通过动态建模模态特定和共享特征,解决了跨模态差异和类内变异问题,实验结果在多个数据集上优于现有方法。
DiffusionSat 是一个大型生成基础模型,利用高分辨率遥感数据集进行训练,能够处理卫星图像生成和超分辨率等多种任务。此外,研究还提出了基于深度学习的模型,用于多光谱和高光谱图像建模,展示了其在数据同化中的应用潜力。
提出了一种名为 UniRGB-IR 的可扩展和高效框架,利用适应器(adapter)将丰富的 RGB-IR 特征引入基于 RGB 的预先训练基础模型,该方法在各种 RGB-IR 下游任务上实现了最先进的性能。
本研究提出了多种新颖方法来解决可见光与红外人物重识别问题,包括特征学习框架、无监督重识别框架和模态对齐技术,显著提升了跨模态检索性能,推动了该领域的发展。
该研究提出了一种基于 I2V-GAN 的视频翻译方法,能够生成细粒度和时空一致的可见光视频。方法结合了对抗损失、循环一致性和相似性约束,并引入了新的 IRVI 数据集。研究还探讨了红外与可见光图像的融合及目标检测等技术,展现了优越的性能和良好的泛化能力。
本研究提出了一种新颖的可见光-红外人物重识别(VI-ReID)框架,通过动态建模模态特定和共享表示,显著提高了特征学习效果。采用深度学习和多模态技术,解决了模态差异和类内变异问题,实验结果在多个数据集上优于现有方法,为24小时监控系统中的人物检索提供了基础。
本文提出了多种方法以改善可见光与红外人员重识别系统的性能,包括四流框架、跨模态对齐和特征学习等。这些方法在多个数据集上表现优于现有技术,显著提高了跨模态检索的准确性和鲁棒性。
本论文提出了一种基于深度学习的多模态图像对齐解决方案,通过使用卷积神经网络的特征嵌入模块,实现了与最先进方法相媲美的结果。
可见 - 红外人员再识别(VIReID)通过融合高级语义与视觉特征来处理不同模态的人员图像之间的身份匹配。基于 CLIP 的语义发现网络(CSDN)通过多模态学习的文本标记和集成文本特征来嵌入高级语义信息,提高了视觉特征的模态不变性。实验评估证实了 CSDN 方法的有效性和优越性。
研究人员提出了一种基于可见光和热红外图像融合的目标跟踪方法,通过即时学习将两种模态信息融合,实现了高效且有效的跟踪架构。该方法在保持高运行速度的同时,实现了最先进的性能。
研究人员提出了一种基于可见光和热红外图像融合的目标跟踪方法,通过轻量级的即时学习器实现了两种模态信息的全面融合,该跟踪架构既有效又高效。
本研究提出了一种基于文本引导的多模态图像融合方法,通过结合红外和可见光图像的语义信息,为目标检测任务提供更准确和鲁棒的结果。研究使用代码增强融合动态的表达,并通过双层优化策略同时优化融合和检测问题,取得了与现有方法相比更高的检测平均精度和视觉上优越的融合结果。
通过引入区域数据增强和轻量级混合补偿模块的转移感知行人关注学习 (TMPA) 模型,提出了一种新颖的可见 - 红外行人再识别方法。实验证明了TMPA模型的有效性。
本研究使用非标记的SAR数据,通过预训练和微调DINO模型,预测高分辨率土地覆盖地图。发现预训练模型性能略有提升,讨论了自监督学习在遥感和土地覆盖分割中的局限性和机会。展示了ViT的注意力图在遥感领域具有内在价值,并可能为其他算法提供有用的输入。为地球观测提供更好的自监督学习模型基础。
完成下面两步后,将自动完成登录并继续当前操作。