小红花·文摘

OpenClaw v2026.4.22更新：腾讯混元上线、GPT-5.5支持和多模态成闭环

极道 ·

刚刚，姚顺雨腾讯首秀来了！三个月重建混元新模型，实测到底什么水平

爱范儿 ·

腾讯引入前Sea AI Lab高级研究科学家庞天宇，负责多模态模型团队的强化学习算法研究。他在机器学习领域有多项研究成果和奖项。腾讯混元团队持续研发多模态模型，已成为全球开源模型的领先者。

腾讯混元再引强将，庞天宇即将入职多模态模型团队负责强化学习前沿算法探索

量子位 ·

腾讯混元图像3.0图生图模型已开源，成为全球领先的唯一开源模型，支持多样化的图片编辑，适合普通和专业用户。开发者可通过主流平台获取该模型，推动应用研发。

腾讯混元图像3.0图生图开源，LMArena跻身全球第一梯队，开源最强

量子位 ·

腾讯发布的HunyuanOCR模型是一款轻量级开源OCR视觉语言模型，具备高效的文本检测、识别和复杂文档解析能力。该模型采用端到端架构，结合原生ViT和轻量LLM，克服了传统模型的局限性，已在多个平台开源，推动科研与工业应用。

混元OCR模型核心技术揭秘：统一框架、真端到端

量子位 ·

腾讯混元数字人团队发布Moral RolePlay基准，揭秘大模型的「道德困境」

机器之心 ·

刚刚！腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力

机器之心 ·

腾讯混元图像3.0在全球文生图模型中排名第一，超越谷歌Nano Banana等闭源模型。该模型采用多模态架构，具备强大的语义理解和生成能力，支持多种输入输出形式，展现出卓越的技术实力。

刚刚，全球AI生图新王诞生！腾讯混元图像3.0登顶了

量子位 ·

腾讯发布的混元图像3.0是当前参数最多的开源生图模型，拥有80B参数，支持多分辨率图像生成，具备强大的指令遵从和文字渲染能力，效果媲美领先的闭源模型。

可能是目前效果最好的开源生图模型，混元生图3.0来了

量子位 ·

腾讯混元团队推出了首个高质量原生3D组件生成模型Hunyuan3D-Part，解决了现有3D生成方法的可控性和几何质量问题。该模型通过P3-SAM和X-Part实现高精度组件分割和生成，适用于视频游戏和3D打印等领域。

业界首个高质量原生3D组件生成模型来了！来自腾讯混元团队

量子位 ·

spring-ai-hunyuan项目已更新至1.0.0.2版本，新增思考链、语音识别（ASR）和语音合成（TTS）功能，提升文本生成场景的开发体验。项目源码已开源，集成简单，支持流式和阻塞式问答，适合数据驱动应用。

混元开源之力：spring-ai-hunyuan 项目功能升级与实战体验 - 努力的小雨

努力的小雨 ·

腾讯混元团队推出的PromptEnhancer框架，通过思维链提示重写，提升AI绘画文本-图像对齐精度，准确率提高17%。该框架无需修改模型权重，适用于多种T2I模型，助力研究人员优化提示技术，并开源高质量基准测试数据集，推动AI绘画的可控性与创作效率。

腾讯混元开源AI绘画新框架：24维度对齐人类意图，让AI读懂复杂指令

量子位 ·

腾讯混元升级了AI绘画微调方法，通过Direct-Align和语义相对偏好优化（SRPO）显著提升了图像的真实感和美学评分，人工评估分数提高300%。新方法在32块H20上训练10分钟即可收敛，解决了传统模型的优化局限性，并支持在线调整奖励信号，生成图像质量显著提升。

腾讯混元升级AI绘画微调范式，在整个扩散轨迹上优化，人工评估分数提升300%

量子位 ·

腾讯开源的混元图像模型2.1支持2K高清生图，具备强大的生成效果和复杂语义理解能力，迅速成为Hugging Face全球第三热门，适用于多种视觉创作需求，助力设计师高效创作。

腾讯混元发布并开源图像模型2.1，支持原生2K生图

量子位 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

全球机器翻译比赛拿下30个语种第1名，腾讯混元翻译模型开源

机器之心 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

手机也能跑，腾讯混元一口气开源4款小模型

机器之心 ·

腾讯混元推出四款小尺寸开源模型，参数分别为0.5B、1.8B、4B和7B，适用于手机和低功耗设备。这些模型具备快速推理和高性价比，支持复杂任务处理，并已在多个应用中验证其实用性。模型的上下文窗口可处理超长内容，提升了多行业的应用潜力。

手机也能跑大模型，腾讯混元推出多款小尺寸开源模型

量子位 ·

腾讯混元团队提出的MixGRPO框架结合了SDE与ODE采样，显著提升了图像生成的效率和性能，训练时间减少近50%。MixGRPO-Flash进一步将训练时间降低71%，在多个维度上优于DanceGRPO，推动了图像生成技术的发展。

训练时间减半，性能不降反升！腾讯混元开源图像生成高效强化方案MixGRPO

量子位 ·

腾讯发布的混元3D世界模型1.0是首个支持物理仿真的开源3D生成系统，用户可通过文本或图像一键生成高质量可交互的3D场景，兼容主流3D建模软件，适用于虚拟现实和游戏开发等领域。

腾讯发布混元3D世界模型1.0：首个支持物理仿真的开源世界生成系统

量子位 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

机器之心 ·