DEV Community ·

Qwen 3 基准测试、比较、模型规格及更多信息

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

Qwen3是阿里巴巴于2025年4月29日发布的开源AI模型，参数规模从600M到32B不等。其混合专家架构实现了高效计算，支持深度推理和快速响应，训练数据涵盖119种语言，适合编程和逻辑问题解决。

🎯

关键要点

Qwen3是阿里巴巴于2025年4月29日发布的开源AI模型，参数规模从600M到32B不等。
Qwen3采用混合专家架构，实现高效计算，支持深度推理和快速响应。
Qwen3提供多种模型选择，包括235B的旗舰模型和多种密集模型。
所有模型均在Apache 2.0许可下发布，适合商业应用。
Qwen3-235B在多个基准测试中表现优异，但在某些任务上落后于Gemini 2.5 Pro。
Qwen3具有双重“思考”模式，能够在深度推理和快速响应之间切换。
Qwen3的MoE架构使其在运行时只激活部分参数，从而降低计算成本。
Qwen3训练于36万亿个标记，支持119种语言，具备多语言能力。
Qwen3在编程、数学和逻辑问题解决方面表现出色，能够作为AI代理使用工具或浏览网页。
用户可以通过Hugging Face、GitHub和Ollama获取Qwen3模型及相关文档。

🔎

延伸解读

多样化的模型选择

Qwen3提供多种参数规模的模型，从600M到32B不等，用户可以根据需求选择合适的模型。这种灵活性使得Qwen3适用于不同的应用场景，无论是资源有限的环境还是需要高性能的复杂任务。

混合专家架构的优势

Qwen3采用混合专家架构（MoE），在运行时仅激活部分参数，这不仅降低了计算成本，还提高了效率。这种设计使得即使是大型模型也能在资源有限的情况下高效运行，适合商业应用。

双重思考模式的实用性

Qwen3的双重“思考”模式允许在深度推理和快速响应之间切换，用户可以根据任务需求选择合适的模式。这种灵活性在处理复杂问题时尤为重要，能够提高工作效率。

多语言支持的广泛性

Qwen3训练于36万亿个标记，支持119种语言，展现出强大的多语言能力。这使得它在全球范围内的应用潜力巨大，尤其适合需要多语言处理的项目和用户。

❓

延伸问答

Qwen3的参数规模范围是多少？

Qwen3的参数规模从600M到32B不等。

Qwen3采用了什么样的架构？

Qwen3采用了混合专家架构（MoE），实现高效计算。

Qwen3在基准测试中的表现如何？

Qwen3-235B在多个基准测试中表现优异，但在某些任务上落后于Gemini 2.5 Pro。

Qwen3支持多少种语言？

Qwen3支持119种语言。

如何获取Qwen3模型？

用户可以通过Hugging Face、GitHub和Ollama获取Qwen3模型及相关文档。

Qwen3的双重“思考”模式有什么特点？

Qwen3可以在深度推理和快速响应之间切换，以适应不同的任务需求。

🏷️