小红花·文摘

最近的多模态大型语言模型在感知图像和遵循开放性指令方面表现出令人印象深刻的能力。研究者提出了Muffin框架和UniMM-Chat数据集，Muffin在广泛的视觉语言任务中实现了最先进的性能。

BriefGPT - AI 论文速递 ·

最近的多模态大型语言模型在感知图像和遵循开放性指令方面表现出令人印象深刻的能力。研究者提出了Muffin框架和UniMM-Chat数据集，Muffin在广泛的视觉语言任务中实现了最先进的性能。

BriefGPT - AI 论文速递 ·