量子位 ·

腾讯混元图像3.0图生图开源，LMArena跻身全球第一梯队，开源最强

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

腾讯混元图像3.0图生图模型已开源，成为全球领先的唯一开源模型，支持多样化的图片编辑，适合普通和专业用户。开发者可通过主流平台获取该模型，推动应用研发。

🎯

🔎

腾讯混元图像3.0图生图模型的开源使其成为全球唯一的开源图像编辑模型，这为开发者提供了一个强大的基础平台。开源不仅促进了技术的透明性，还能加速社区的创新与应用研发，吸引更多用户参与其中。

该模型支持多种图片编辑功能，适合普通用户和专业用户。普通用户可以用其制作表情包和社交分享，而专业用户则能在电商和游戏设计中提升创作效率。这种广泛的适用性使得混元图像3.0在市场上具有竞争优势。

混元图像3.0基于多模态架构，结合文本理解与图像生成，展现出强大的推理能力。其“先思考，后编辑”的流程确保了编辑的精准性和高效性，这在图像编辑领域是一个重要的技术创新，值得关注。

❓

该模型支持多样化的图片编辑功能，包括增、删、改、风格变换等，适合普通和专业用户。

该模型在LMArena的图像编辑榜单中跻身全球第一梯队，是唯一的开源模型。

开发者可以通过Github和Hugging Face等主流开源平台获取模型的权重及完整代码。

模型的核心创新在于其“先思考，后编辑”的工作流程，能够理解图像内容后进行推理和编辑。

该模型适合普通用户用于社交分享和表情包制作，也适合专业用户进行电商海报设计和创意图片制作。

腾讯混元团队持续迭代基础能力，研发了多种尺寸的语言模型和完整的多模态生成模型，广泛应用于多个行业。

🏷️