腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
💡
原文中文,约2100字,阅读约需5分钟。
📝
内容提要
腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B,推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口,适合个人开发者使用。同时,腾讯还开源了两个新数据集,以提升大语言模型的能力。
🎯
关键要点
- 腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B。
- Hunyuan-A13B在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口。
- 模型已在Github和Huggingface等开源社区上线,支持快速接入部署。
- Hunyuan-A13B是业界首个13B级别的MoE开源混合推理模型,推理速度快且性价比高。
- 腾讯混元建设了多Agent数据合成框架,通过强化学习提升Agent能力。
- 模型支持快思考和慢思考模式,优化计算资源分配。
- Hunyuan-A13B对个人开发者友好,仅需1张中低端GPU卡即可部署。
- 模型训练了20T tokens的语料,显著提升了通用能力。
- 腾讯开源了两个新数据集ArtifactsBench和C3-Bench,以提升大语言模型能力。
- Hunyuan-A13B是腾讯内部应用和调用量最大的模型之一,日均请求超1.3亿。
- 腾讯混元计划推出更多尺寸和特色的模型,促进大模型开源生态的繁荣。
- 未来将推出多尺寸混合推理模型,适配企业与端侧不同需求。
➡️