通义千问Qwen3发布,开源8款「混合推理模型」

通义千问Qwen3发布,开源8款「混合推理模型」

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

Qwen3正式发布并开源8款混合推理模型,包括两款MoE模型和六个Dense模型。旗舰模型Qwen3-235B-A22B在多项基准测试中表现优异,而Qwen3-30B-A3B则在激活参数更少的情况下性能更强。模型可在多个平台上使用,推动大型基础模型的研究与开发。

🎯

关键要点

  • Qwen3正式发布并开源8款混合推理模型,包括两款MoE模型和六个Dense模型。
  • 旗舰模型Qwen3-235B-A22B在多项基准测试中表现优异。
  • 小型MoE模型Qwen3-30B-A3B在激活参数更少的情况下性能更强。
  • 模型可在Hugging Face、ModelScope和Kaggle等平台上使用。
  • 推荐使用SGLang和vLLM等框架进行部署,Ollama、LMStudio等工具适合本地使用。
  • Qwen3的发布将推动大型基础模型的研究与开发。
  • 全球开发者、研究机构和企业可免费在多个平台下载模型并商用。
  • 个人用户可通过通义APP体验Qwen3,夸克也即将接入Qwen3。

延伸问答

Qwen3发布了哪些类型的模型?

Qwen3发布了两款MoE模型和六个Dense模型,共计八款混合推理模型。

Qwen3-235B-A22B模型的特点是什么?

Qwen3-235B-A22B是旗舰模型,在多项基准测试中表现优异,具有2350多亿总参数和220多亿激活参数。

如何部署Qwen3模型?

推荐使用SGLang和vLLM等框架进行部署,Ollama、LMStudio等工具适合本地使用。

Qwen3模型可以在哪些平台上使用?

Qwen3模型可在Hugging Face、ModelScope和Kaggle等平台上使用。

Qwen3的发布对研究和开发有什么影响?

Qwen3的发布将推动大型基础模型的研究与开发,为全球研究人员和开发者提供创新解决方案的机会。

个人用户如何体验Qwen3?

个人用户可以通过通义APP直接体验Qwen3,夸克也即将接入Qwen3。

➡️

继续阅读