Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

💡 原文中文,约1400字,阅读约需4分钟。
📝

内容提要

Qwen3小升级后性能超越Kimi K2,支持256K长上下文,提升指令遵循和逻辑推理能力。新模型采用MoE架构,参数量达到235B,表现优异,预告更大更新即将到来。

🎯

关键要点

  • Qwen3小升级后性能超越Kimi K2,支持256K长上下文。
  • 新模型采用MoE架构,参数量达到235B,表现优异。
  • Qwen官方宣布不再使用混合思维模式,分别训练Instruct和Thinking模型。
  • 新模型显著提升了指令遵循、逻辑推理、文本理解等能力。
  • 基准测试中,新模型在数学推理能力上表现良好,准确率从24.7%上升到70.3%。
  • Qwen3新版本发布后获得好评,已在中等规模语言模型中领先。
  • NVIDIA发布的新模型OpenReasoning-Nemotron基于Qwen-2.5微调。
  • 开源基础大模型的竞争正在进入中国时间。
➡️

继续阅读