量子位 ·

腾讯混元推出首款开源混合推理模型，擅长Agent工具调用和长文理解

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

腾讯推出首款开源混合推理模型Hunyuan-A13B，参数80B，激活参数13B，推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异，支持256K上下文窗口，适合个人开发者使用。同时，腾讯还开源了两个新数据集，以提升大语言模型的能力。

🎯

🔎

Hunyuan-A13B模型支持快思考和慢思考两种模式，用户可以根据任务需求灵活选择。这种设计不仅提高了推理效率，还能在不同复杂度的任务中实现更好的性能，适合多种应用场景。开发者在使用时应考虑任务的性质，以选择最合适的思考模式。

腾讯混元的开源策略不仅推出了Hunyuan-A13B模型，还同时开源了两个新数据集，旨在填补行业评估标准的空白。这种做法有助于提升大语言模型的能力，并促进整个开源生态的繁荣。开发者可以利用这些资源进行更深入的研究和应用开发。

Hunyuan-A13B模型对个人开发者非常友好，仅需一张中低端GPU卡即可部署。这降低了技术门槛，使得更多开发者能够参与到大语言模型的应用与开发中，推动了技术的普及和创新。

❓

Hunyuan-A13B模型具有80B的总参数和13B的激活参数，支持256K上下文窗口，推理速度快且性价比高，特别擅长长文理解和Agent工具调用。

Hunyuan-A13B模型对个人开发者友好，仅需1张中低端GPU卡即可部署，降低了使用门槛。

腾讯开源了ArtifactsBench和C3-Bench两个新数据集，分别用于评估代码生成和Agent场景模型的能力。

Hunyuan-A13B模型支持快思考和慢思考模式，快思考模式适合简单任务，慢思考模式适合复杂推理，优化了计算资源分配。

Hunyuan-A13B模型在多个长文数据集中取得了优异成绩，支持256K原生上下文窗口，表现突出。

腾讯混元计划推出更多尺寸和特色的混合推理模型，以适配企业与端侧不同需求，促进大模型开源生态的繁荣。

🏷️