量子位 ·

可能是目前效果最好的开源生图模型，混元生图3.0来了

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

腾讯发布的混元图像3.0是当前参数最多的开源生图模型，拥有80B参数，支持多分辨率图像生成，具备强大的指令遵从和文字渲染能力，效果媲美领先的闭源模型。

🎯

关键要点

腾讯发布的混元图像3.0是当前参数最多的开源生图模型，拥有80B参数。
混元图像3.0支持多分辨率图像生成，具备强大的指令遵从和文字渲染能力。
该模型融合了文本理解、视觉理解与高保真图像生成，效果媲美领先的闭源模型。
混元图像3.0采用VAE+ViT的双编码器结构，精准解析图像内容。
引入广义因果注意力，兼顾语言因果推理与图像全局建模。
模型经过多阶段训练，逐步提升图像分辨率和复杂性。
评测结果显示，混元图像3.0在语义一致性和生成效果上超越业界领先模型。
模型开源，代码与权重同步释出，支持社区使用与开发。

🏷️

继续阅读

像OpenCode、Cline和Aider这样的开源编码代理正在为开发者解决一个巨大的难题
越来越多的开放项目在探索开放代理架构，如OpenCode和Kilo Code等工具引入付费层以覆盖基础设施成本。Cline是一个来自2024年Anthro...
那个让马斯克点赞的男人，为什么还是离开了阿里？ - 蝈蝈俊
林俊旸于3月4日辞职，标志着中国AI界的重大变革。他的离开反映了开源与商业之间的矛盾，以及技术理想与管理体制的冲突。作为Qwen的核心人物，他推动了该模型...
别再把 AI 当聊天框了,OpenCowork 让它真正「会干活」
OpenCowork 是一个开源桌面 AI 工作站，旨在整合 AI 工具以提升团队生产力。它支持本地工作流、团队协作和任务自动化，解决了 AI 在日常工作...
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型，能够自动识别近2500种动物，帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起，该工具在多个国家的项目中应用...
一分钟读论文：《ICLR2026新CAGE技术破解跨文化AI安全测试难题》
CAGE技术由韩国SelectStar公司研发，旨在解决AI安全测试中的文化偏见问题。它通过“语义模具”方法自动生成适应不同文化的红队测试数据，显著提升小...
CNCF毕业Dragonfly，标志着云原生图像分发的重要里程碑
云原生计算基金会（CNCF）宣布开源图像和文件分发系统Dragonfly已达到毕业状态，标志着其生产就绪和行业广泛采用。Dragonfly利用P2P加速技...

可能是目前效果最好的开源生图模型，混元生图3.0来了

内容提要

关键要点

标签

继续阅读