小红花·文摘

研究评估了多个开源和闭源模型，并开发了一种对比的思维链（CoCoT）启发方法来增强大型多模态模型（LMMs）的性能。实验结果展示了CoCoT在增强多模态模型的多图像理解能力方面的熟练度。

BriefGPT - AI 论文速递 ·

BriefGPT - AI 论文速递 ·

本文提出了一种多模态图像融合框架，解决了可见光图像与红外图像焦点区域不同的融合问题。通过分解图像为结构和纹理成分，并使用多尺度操作器对纹理成分进行融合，同时考虑能量信息的分布，实现了场景亮度的捕捉和对比度的维持。实验结果表明，该算法优于现有方法。

BriefGPT - AI 论文速递 ·