Qwen3-Max参数规模超万亿,多项基准测试达SOTA,预告推理增强版本达奥数竞赛满分水平

Qwen3-Max参数规模超万亿,多项基准测试达SOTA,预告推理增强版本达奥数竞赛满分水平

💡 原文中文,约3400字,阅读约需8分钟。
📝

内容提要

阿里云云栖大会于9月24日召开,AI成为主要议题。阿里发布了多款高性能模型,包括参数达到1T的Qwen3-Max,其表现超越GPT-5。此外,Qwen3-VL和Qwen3 Coder Plus也展现出强大的多模态和编程能力。

🎯

关键要点

  • 阿里云云栖大会于9月24日召开,AI成为主要议题。
  • 阿里发布了多款高性能模型,包括参数达到1T的Qwen3-Max,其表现超越GPT-5。
  • Qwen3-VL和Qwen3 Coder Plus展现出强大的多模态和编程能力。
  • 基于通义千问二次开发的衍生模型数量已达到17万,超过美国Llama系列。
  • Qwen3-Max是规模最大、能力最强的模型,参数超过1T,预训练使用了36T tokens。
  • Qwen3-Max在多个评测基准上表现优异,特别是在编程和智能体能力方面。
  • Qwen3-VL是多模态视觉-语言模型,整体效果位于全球第一梯队。
  • Qwen3-VL在视觉理解与文本生成能力上取得显著进步,支持长上下文和复杂场景。
  • Qwen3 Coder Plus是对前代Coder的全面升级,提供更高的编程效率和准确性。

延伸问答

Qwen3-Max模型的参数规模是多少?

Qwen3-Max模型的参数规模超过1T。

Qwen3-VL模型在视觉理解方面有哪些进展?

Qwen3-VL在视觉理解与文本生成能力上取得显著进步,支持长上下文和复杂场景。

Qwen3 Coder Plus与前代模型相比有什么升级?

Qwen3 Coder Plus是对前代Coder的全面升级,提供更高的编程效率和准确性。

Qwen3-Max在编程能力方面的表现如何?

Qwen3-Max在编程能力的基准测试中表现优异,取得了69.6分的好成绩。

Qwen3-VL的多模态能力有哪些具体应用?

Qwen3-VL能操作电脑和手机界面,识别GUI元素,执行任务,展现出强大的多模态能力。

Qwen3-Max的推理增强版本有什么特点?

Qwen3-Max的推理增强版本在深度推理能力上达到新高,在数学推理基准测试中取得满分。

➡️

继续阅读