量子位 ·

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

Qwen3小升级后性能超越Kimi K2，支持256K长上下文，提升指令遵循和逻辑推理能力。新模型采用MoE架构，参数量达到235B，表现优异，预告更大更新即将到来。

🎯

❓

Qwen3的新模型增强了对256K长上下文的理解能力，提升了指令遵循、逻辑推理、文本理解等能力，并且在数学推理上准确率从24.7%上升到70.3%。

Qwen3的参数量达到235B。

Qwen官方宣布不再使用混合思维模式，而是分别训练Instruct和Thinking模型。

在基准测试中，Qwen3在数学推理能力上表现良好，准确率显著提升。

Qwen3在基准测试性能上超越了Kimi K2，尽管参数量仅为其四分之一。

Qwen3的新模型采用了MoE架构。

🏷️

DeepSeek-V4终于发布：1M上下文重塑AI成本结构与Agent编程范式
DeepSeek-V4发布，采用开源与MoE架构，实现低成本高性能，提升应用开发效率。Pro与Flash版本满足不同需求，Agent能力使模型从工具升级为...
权威认可 | 绿盟科技防火墙实力入选“2025中国网络安全防火墙市场销量明星品牌”
绿盟科技防火墙被评为“2025中国网络安全防火墙市场销量明星品牌”。分析显示，硬件防火墙仍主导市场，但云防火墙和AI技术将推动新一轮增长。绿盟科技推出Op...
灯光、摄像、开源！
这篇文章讨论了Cult.Repo制作关于开源软件及其背后人物的纪录片。制片人Emma Tracey和Josiah Mcgarvie探讨了开源项目的吸引力，...
E Ink元太科技与BMW合作，推动电子纸技术在汽车外观的实际应用
（全球TMT2026年4月24日讯）全球电子纸领导厂商E Ink元太科技4月24日宣布，搭载E Ink Pri […]
HashiCorp Vault 2.0 Marks Shift to IBM Lifecycle with New Identity Federation
HashiCorp has released Vault 2.0, moving to the IBM versioning and support mo...
产品，还是玩具？ — Baby Press(缝合怪)
这算是给这个东西写的第二篇正式的文章，本来我的想法很简单，做一个简单的前后端分离的系统来完全替代wp的php渲 […]