小红花·文摘

InternLM-XComposer是一种高级视觉语言模型，能够理解和组合图像和文本。它具有交错式文本-图像组合、多语言知识理解和卓越性能等特点。该模型在主流视觉-语言基准测试中表现出色。

SongComposer: 歌曲生成中用于歌词和旋律创作的大型语言模型

BriefGPT - AI 论文速递 ·

InternLM-XComposer是一种视觉语言模型，具有交错式文本-图像组合、基于多语言知识的理解和最先进的性能等特点。该模型能够智能地识别文本中可以增强内容的图像区域，并自动插入最合适的视觉候选。在各种主流视觉-语言基础模型基准测试中，InternLM-XComposer始终取得最先进的结果。该模型已公开提供于指定URL。

InternLM-XComposer：面向高级文本图像理解与构图的视觉语言大模型

BriefGPT - AI 论文速递 ·