Blog on Qwen ·

Qwen2.5-Max：探索大规模 MoE 模型的智能

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

Qwen2.5-Max 是一种超大规模 MoE 模型，使用超过 20 万亿 token 进行训练。在多项基准测试中，该模型表现优异，尤其在知识和编程能力评估中超越 DeepSeek V3。目前已通过 API 开放使用，未来将继续探索数据和模型规模的提升。

🎯

🔎

Qwen2.5-Max 作为超大规模 MoE 模型，使用超过 20 万亿 token 进行训练，展现出在知识和编程能力评估中的卓越表现。这种规模的模型在处理复杂任务时，能够更好地理解上下文和生成更准确的回答，显示出其在人工智能领域的潜力。

Qwen2.5-Max 现已通过 API 开放使用，用户可以方便地在 Qwen Chat 中与模型进行对话。这种兼容 OpenAI API 的设计，使得开发者能够轻松集成该模型，推动了其在实际应用中的普及和发展。

Qwen 团队计划在未来继续探索数据和模型规模的提升，尤其是在强化学习方面。这一方向的研究可能会推动 AI 技术的进一步发展，甚至实现超越人类的智能，值得关注其后续进展。

❓

Qwen2.5-Max 是一种超大规模的 MoE 模型。

Qwen2.5-Max 使用了超过 20 万亿 token 的训练数据。

Qwen2.5-Max 在多项基准测试中表现优异，尤其在知识和编程能力评估中超越了 DeepSeek V3。

用户可以通过 Qwen Chat 直接与 Qwen2.5-Max 对话，或使用 API 进行访问。

未来将继续探索数据和模型规模的提升，特别是在强化学习方面，以期实现超越人类的智能。

可以通过注册阿里云账号并创建 API 密钥，使用与 OpenAI API 兼容的方式进行调用。

🏷️