Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
💡
原文中文,约1400字,阅读约需4分钟。
📝
内容提要
Qwen3小升级后性能超越Kimi K2,支持256K长上下文,提升指令遵循和逻辑推理能力。新模型采用MoE架构,参数量达到235B,表现优异,预告更大更新即将到来。
🎯
关键要点
- Qwen3小升级后性能超越Kimi K2,支持256K长上下文。
- 新模型采用MoE架构,参数量达到235B,表现优异。
- Qwen官方宣布不再使用混合思维模式,分别训练Instruct和Thinking模型。
- 新模型显著提升了指令遵循、逻辑推理、文本理解等能力。
- 基准测试中,新模型在数学推理能力上表现良好,准确率从24.7%上升到70.3%。
- Qwen3新版本发布后获得好评,已在中等规模语言模型中领先。
- NVIDIA发布的新模型OpenReasoning-Nemotron基于Qwen-2.5微调。
- 开源基础大模型的竞争正在进入中国时间。
➡️