变色龙:混合模式早期融合基础模型
原文中文,约400字,阅读约需1分钟。发表于: 。Chameleon 是一种早期融合的基于令牌的混合模态模型系列,能够理解和生成任意顺序的图像和文本。它在图像问答、图像描述、文本生成、图像生成和长格式混合模态生成等任务上展现了广泛和通用的能力,包括在图像描述任务中达到了最先进的性能水平,同时在纯文本任务中超越了 Llama-2,与 Mixtral 8x7B 和 Gemini-Pro...
Chameleon是一种基于令牌的混合模态模型系列,能够理解和生成任意顺序的图像和文本。它在多个任务上展现了广泛和通用的能力,并在图像描述任务中达到了最先进的性能水平。它还在长格式混合模态生成评估中超越了更大模型,是统一建模完整多模态文档的重要一步。