量子位 ·

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

Qwen3小升级后性能超越Kimi K2，支持256K长上下文，提升指令遵循和逻辑推理能力。新模型采用MoE架构，参数量达到235B，表现优异，预告更大更新即将到来。

🎯

关键要点

Qwen3小升级后性能超越Kimi K2，支持256K长上下文。
新模型采用MoE架构，参数量达到235B，表现优异。
Qwen官方宣布不再使用混合思维模式，分别训练Instruct和Thinking模型。
新模型显著提升了指令遵循、逻辑推理、文本理解等能力。
基准测试中，新模型在数学推理能力上表现良好，准确率从24.7%上升到70.3%。
Qwen3新版本发布后获得好评，已在中等规模语言模型中领先。
NVIDIA发布的新模型OpenReasoning-Nemotron基于Qwen-2.5微调。
开源基础大模型的竞争正在进入中国时间。

🏷️

继续阅读

88岁图灵奖得主，用Claude一小时破解30年数学悬案
88岁图灵奖得主高德纳对Claude AI在1小时内解决他研究30年的三维图论问题感到震惊。Claude通过结构性思维而非暴力搜索，展现了逻辑推理和创造性...
IBM咨询助力中国汽车产业实现跨越式升级
IBM咨询将分享行业领军者的经验，探讨中国汽车产业面临的五大困境，如成本上升和新能源车挑战。通过与车企合作，IBM运用生成式AI和数字化供应链提升研发效率...
如果你三年前购买了笔记本电脑，苹果的新M5 Max感觉像是一次巨大的升级
M5 Max在性能上显著优于M2 Max，单核性能提升55%，多核性能几乎翻倍，GPU渲染性能提升64%，在Premiere Pro中4K导出时间减少30%。
一次有诚意的升级，一份加量不加价的体验：iPhone 17e 首发体验
iPhone 17e作为入门版，起售价不变，存储容量翻倍，告别128GB时代。外观与前代相同，新增浅粉色选项，支持MagSafe充电。配备4800万像素镜...
一次常规的升级，一个适合更多人的选择：新款 iPad Air 首发体验
iPad Air 升级至 M4 芯片后，性价比依然高。外观与前代相同，但性能在日常使用中表现优异，适合大多数用户。内存提升至 12GB，满足更高需求。虽然...
苹果官宣核心管理层调整；英伟达停产向中国销售H200芯片；安世荷兰批量禁用安世中国员工办公软件
苹果调整管理层，英伟达停产H200芯片，安世禁止中国员工使用办公软件，腾讯推出OpenClaw引发用户排队，甲骨文计划裁员。

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

内容提要

关键要点

标签

继续阅读