量子位 ·

中国唯一！阿里千问斩获全球AI顶会最佳论文

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

阿里通义千问团队在NeurIPS 2025会议上获得最佳论文奖，成为唯一获此荣誉的中国团队。研究揭示了注意力门控机制对大模型性能的影响，推动了AI技术的发展。该成果已应用于Qwen3-Next模型，显著提升了性能与鲁棒性。

🎯

🔎

尽管现有的大模型在多个领域表现出色，但注意力机制的局限性仍然显著。这些局限性可能导致模型对关键信息的过度关注，从而忽略其他重要信息。阿里通义千问团队的研究通过门控机制的引入，提供了一种有效的解决方案，可能会改变未来大模型的训练方式。

阿里通义千问团队的研究成果已成功应用于Qwen3-Next模型，显著提升了模型的性能与鲁棒性。这一技术的开源不仅推动了学术界的研究，也为工业界提供了新的工具，可能会加速AI技术的普及与应用。

NeurIPS会议是人工智能领域最具影响力的会议之一，吸引了全球顶尖科技公司和研究机构的参与。阿里通义千问团队在此会议上获得最佳论文奖，标志着中国在全球AI研究中的崛起，显示出中国团队在前沿技术研究中的竞争力。

❓

阿里通义千问团队在NeurIPS 2025会议上获得了最佳论文奖，是唯一获此荣誉的中国团队。

注意力门控机制可以帮助模型过滤无效信息，显著提升模型性能和训练稳定性。

NeurIPS是人工智能领域影响力最大的顶会之一，吸引了全球顶尖科技公司和机构的论文投稿。

该研究成果已应用于Qwen3-Next模型，显著提升了模型的性能与鲁棒性。

该研究被认为是突破大模型训练瓶颈的重要一步，将推动AI大模型技术的发展。

阿里千问已开源300多款模型，全球下载量突破7亿次，衍生模型超过18万个。

🏷️