量子位 ·

腾讯发最大开源MoE模型，3890亿参数免费可商用，跑分超Llama3.1

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

腾讯发布了开源MoE模型Hunyuan-Large，参数达3890亿，支持256k上下文长度，免费商用。该模型在数学能力和长文本处理上表现优异，采用混合路由策略和高质量合成数据，提升推理效率和训练稳定性。

🎯

关键要点

腾讯发布了开源MoE模型Hunyuan-Large，参数达3890亿，支持256k上下文长度，免费商用。
Hunyuan-Large在数学能力和长文本处理上表现优异，跑分超过Llama 3.1。
模型采用混合路由策略和高质量合成数据，提升推理效率和训练稳定性。
开源版本包括预训练模型、微调模型和FP8量化的微调模型。
技术报告中计算了MoE的Scaling Law公式，揭示了模型的计算预算。
Hunyuan-Large采用共享专家和特殊专家的混合路由策略，保持负载均衡。
高质量合成数据的生成流程包括指令生成、指令进化、回答生成和回答过滤。
模型通过分阶段训练和优化位置编码来提升长文本处理能力。
推理效率通过KV Cache压缩技术显著提升，内存占用降低约95%。
后训练策略包括监督微调和人类反馈强化学习，以增强模型能力和人类对齐程度。
腾讯计划逐步开源中小型号的模型，满足个人开发者需求。

❓

延伸问答

Hunyuan-Large模型的参数有多少？

Hunyuan-Large模型的参数达3890亿。

Hunyuan-Large模型支持的上下文长度是多少？

Hunyuan-Large模型支持256k的上下文长度。

Hunyuan-Large模型在数学能力上表现如何？

Hunyuan-Large在数学能力上表现优异，跑分超过Llama 3.1。

Hunyuan-Large模型采用了什么样的路由策略？

Hunyuan-Large采用了共享专家和特殊专家的混合路由策略。

腾讯计划如何支持个人开发者使用Hunyuan-Large模型？

腾讯计划逐步开源中小型号的模型，以满足个人开发者的需求。

Hunyuan-Large模型的推理效率如何提升？

推理效率通过KV Cache压缩技术显著提升，内存占用降低约95%。

🏷️

继续阅读

百度文心发布 PaddleOCR-VL-1.6：准确率突破 96.33%，刷新文档解析 SOTA
百度发布的PaddleOCR-VL-1.6在OmniDocBench v1.6评测中准确率超过96.3%，综合性能全球第一，支持100多种语言，适应复杂文...
机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑
清华大学智能产业研究院推出了全新的机器人强化学习训练架构UniLab，打破了传统依赖GPU的训练模式。UniLab通过将仿真解耦到CPU侧，实现了更高的训...
JetBrains开源Mellum2，以超越Claude Code的局限
JetBrains发布了Mellum2，这是一个开源的12B参数编码模型，专注于AI系统的基础设施层。Mellum2支持更广泛的任务，如模型协调和子代理工...
在线教程丨英伟达开源LocateAnything，3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能
NVIDIA 最近推出了视觉语言定位模型LocateAnything-3B，拥有30亿参数，支持多种视觉定位任务。其核心创新为并行框解码（PBD），显著提...
金融机构为何趋向于交易基础模型以构建自身智能
金融机构正在采用交易基础模型，构建统一的智能系统，以克服现有模型的孤立性。通过大型AI系统，机构能够更好地理解消费者行为，提升反欺诈和信用评分等领域的表现...
GPT Realtime 2.0实时语音模型17个创业方向
GPT Realtime 2.0模型实现了边听边思考的实时智能应用，提供了17个创业机会，如实时合同谈判助手、语音控制交易终端和多语种活动主持人。这些应用...