量子位 ·

刚刚，全球AI生图新王诞生！腾讯混元图像3.0登顶了

💡 原文中文，约6200字，阅读约需15分钟。

📝

内容提要

腾讯混元图像3.0在全球文生图模型中排名第一，超越谷歌Nano Banana等闭源模型。该模型采用多模态架构，具备强大的语义理解和生成能力，支持多种输入输出形式，展现出卓越的技术实力。

🎯

🔎

腾讯混元图像3.0采用原生多模态架构，能够处理多种输入输出形式。这种设计使得模型在图像生成和语义理解上具备更强的能力，能够更好地响应复杂的长文本，提升用户体验。

混元图像3.0作为开源模型，凭借其强大的性能超越了多个闭源模型，如谷歌的Nano Banana。这一成就不仅展示了开源技术的潜力，也为开发者和研究者提供了更多的创新空间。

目前，混元图像3.0仅开放了文生图能力，未来版本预计将推出图生图、图像编辑等功能。用户应关注后续更新，以便充分利用模型的多样化能力，提升创作效率。

❓

腾讯混元图像3.0采用原生多模态架构，支持多种输入输出形式，具备强大的语义理解和生成能力，参数规模高达80B，是业界首个开源工业级原生多模态生图模型。

腾讯混元图像3.0在LMArena竞技场的榜单中排名第一，超越了谷歌Nano Banana等多个闭源模型，展现了其卓越的技术实力和用户体验。

混元图像3.0的训练过程分为四个阶段，逐步提高图像分辨率，并结合多模态数据进行联合训练，以增强模型的视觉与推理能力。

混元图像3.0在机器指标和人工评测中表现优异，能够生成高质量的图像，超越多款闭源模型，显示出强大的生成能力。

混元图像3.0能够处理文字、图片、视频与音频等多种模态的输入与输出，具备生图模型的绘画能力和语言模型的思考能力。

凭借领先的技术实力，混元图像3.0在双节假期引发全民热潮，用户体验持续上升，受到广泛关注和好评。

🏷️