小众软件 ·

Qwen3 正式发布：大模型的聪明，小模型的速度｜30B 模型能跑出 3B 速度，私有部署有戏了

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

Qwen3在多个基准测试中表现优异，超越DeepSeek-R1和OpenAI主流模型，特别是在数学、编程和多语言能力方面。其混合思考模式支持119种语言，适应多场景需求，所有模型均开源且可免费商用。

🎯

🔎

Qwen3在多语言能力测试中表现突出，支持119种语言和方言，远超OpenAI的主流模型。这使得Qwen3在全球化应用中具有更强的适应性，尤其适合需要多语种支持的场景，如国际会议、跨国企业沟通等。

Qwen3的混合思考模式允许用户根据任务复杂度灵活切换思考方式，这一设计提升了模型在不同场景下的实用性。用户可以在处理复杂问题时选择逐步推理，而在简单问题上则可快速得到答案，极大提高了工作效率。

Qwen3的开源和可商用特性为企业提供了私有部署的可能性。企业可以根据自身需求定制模型，降低使用成本，同时确保数据安全。这对于希望在内部环境中使用大模型的公司来说，是一个重要的优势。

❓

Qwen3在多个权威基准测试中表现优异，超越了DeepSeek-R1和OpenAI的主流模型，尤其在数学、编程和多语言能力方面。

Qwen3支持119种语言和方言，远超OpenAI的模型。

Qwen3的混合思考模式允许用户根据任务复杂度在逐步推理和高效直答之间灵活切换。

Qwen3共开放8款模型，参数规模覆盖从0.6B到235B。

Qwen3-235B-A22B在编程能力测试中与DeepSeek-R1和OpenAI-o3-mini处于同一梯队，均为顶级水平。

Qwen3的预训练数据量达到36万亿tokens，涵盖STEM、代码、推理等多个领域。

🏷️