量子位 ·

开源模型首超Opus4.6！智谱GLM-5.1登场，14小时后CUDA专家被冲了

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

智谱GLM-5.1模型在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。该模型展示了自主编程、测试和优化的能力，且能在1小时内构建MacOS环境。在SWE-bench Pro测试中，GLM-5.1超越多款顶尖模型，标志着中国开源AI的崛起，推动行业变革。

🎯

关键要点

智谱GLM-5.1模型在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。
GLM-5.1展示了自主编程、测试和优化的能力，能在1小时内构建MacOS环境。
在SWE-bench Pro测试中，GLM-5.1超越多款顶尖模型，标志着中国开源AI的崛起。
GLM-5.1能够自主编写定制Triton Kernel和CUDA Kernel，展现出端到端自主工作能力。
GLM-5.1在优化向量数据库的查询性能方面，通过655轮迭代将QPS提升至21472。
GLM-5.1是全球第一个在真实工程任务中验证了8小时持续工作能力的开源模型。
GLM-5.1的成功源于长程规划、稳定的自适应纠错能力和上下文整合能力的技术突破。
GLM-5.1的出现改变了中国开源模型的叙事逻辑，缩小了与美国顶尖闭源模型的差距。
AI的交付单位从一行代码变为完整项目，冲击了软件工程的生产关系。
GLM-5.1的出现引发了对人类不可替代性的思考，强调了定义问题和创造价值的能力。

❓

延伸问答

智谱GLM-5.1模型的主要突破是什么？

智谱GLM-5.1模型在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。

GLM-5.1如何在SWE-bench Pro测试中表现？

在SWE-bench Pro测试中，GLM-5.1超越多款顶尖模型，刷新了全球最佳成绩，标志着中国开源AI的崛起。

GLM-5.1能在多长时间内构建MacOS环境？

GLM-5.1能够在1小时内构建MacOS环境，展示了其自主编程和测试的能力。

GLM-5.1在向量数据库优化方面的表现如何？

GLM-5.1通过655轮迭代将向量数据库的查询性能提升至21472 QPS，显示了其自主迭代和优化的能力。

GLM-5.1的成功源于哪些技术突破？

GLM-5.1的成功源于长程规划、稳定的自适应纠错能力和上下文整合能力的技术突破。

GLM-5.1如何改变软件工程的生产关系？

GLM-5.1的出现使得AI的交付单位从一行代码变为完整项目，冲击了软件工程的生产关系。

🏷️

继续阅读

继续采用MIT许可证：智谱现已开源旗舰级智能体工程模型GLM-5.1
智谱AI已开源GLM-5.1智能体模型，采用MIT许可证，开发者可通过HF和魔搭平台下载。该模型在编码能力和处理模糊问题上表现优异，支持个人及商业使用。完...
Anthropic年化收入暴涨至300亿美元；智谱发布可持续工作8小时的旗舰模型；潘兴广场提出644亿美元收购环球音乐集团
Anthropic年收入达到300亿美元，马斯克寻求罢免OpenAI高管，潘兴广场计划以644亿美元收购环球音乐，腾讯推出“龙虾”浏览器，智谱发布可持续工...
不到 24 小时，奥特曼的天塌了两次
Sam Altman 面临压力，Anthropic 的年化营收已超越 OpenAI。Anthropic 主要依赖企业客户，收入增长迅速，而 OpenAI ...
混合专家架构在人工智能模型中的工作原理
混合专家（MoE）架构通过将AI模型划分为多个专门子网络来优化性能，仅激活相关专家以减少计算需求。Mixtral模型展示了MoE在实际应用中的高效性，尽管...
卡帕西没做完的，开源社区48小时搞定了！完全体知识库，token省70倍
开源社区在48小时内推出Graphify工具，自动生成知识图谱，节省71.5倍token消耗。该工具支持多模态处理，用户只需一条命令即可生成交互式知识图谱，降低使用门槛。
Inside Spotify’s 2025 Wrapped Archive: AI Narratives at Scale and the Privacy Trade‑Off
Spotify's engineering team developed the 2025 "Wrapped Archive," ...