小红花·文摘

阿里通义千问团队在NeurIPS 2025会议上获得最佳论文奖，成为唯一获此荣誉的中国团队。研究揭示了注意力门控机制对大模型性能的影响，推动了AI技术的发展。该成果已应用于Qwen3-Next模型，显著提升了性能与鲁棒性。

量子位 ·

Qwen3-Next PD 分离机制上线，介绍了 Gated Delta Rule 的计算流程及 vllm 实现，包括推理和训练阶段的 recurrent 和 chunk 两种形式，以及相关计算公式和实现细节。

学习让我快乐 ·

PostHog官网采用操作系统风格设计以提升多任务体验，但用户反馈影响使用体验。美国财政部计划扩展《爱国者法案》，引发隐私担忧。阿里云推出Qwen3-Next模型以提高效率。丹麦超市建设“应急商店”以增强社会韧性。

介绍 on SuperTechFans ·

Vercel News ·

Qwen3-Next模型发布，参数80B，训练成本低，推理速度提升10倍，超越Gemini-2.5-Flash-Thinking。核心改进包括混合注意力机制和高稀疏度MoE结构，支持多模态，具备快速解题和编程能力。

量子位 ·

vLLM Blog ·