量子位 ·

开源模型首超Opus4.6！智谱GLM-5.1登场，14小时后CUDA专家被冲了

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

智谱GLM-5.1模型在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。该模型展示了自主编程、测试和优化的能力，且能在1小时内构建MacOS环境。在SWE-bench Pro测试中，GLM-5.1超越多款顶尖模型，标志着中国开源AI的崛起，推动行业变革。

🎯

关键要点

智谱GLM-5.1模型在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。
GLM-5.1展示了自主编程、测试和优化的能力，能在1小时内构建MacOS环境。
在SWE-bench Pro测试中，GLM-5.1超越多款顶尖模型，标志着中国开源AI的崛起。
GLM-5.1能够自主编写定制Triton Kernel和CUDA Kernel，展现出端到端自主工作能力。
GLM-5.1在优化向量数据库的查询性能方面，通过655轮迭代将QPS提升至21472。
GLM-5.1是全球第一个在真实工程任务中验证了8小时持续工作能力的开源模型。
GLM-5.1的成功源于长程规划、稳定的自适应纠错能力和上下文整合能力的技术突破。
GLM-5.1的出现改变了中国开源模型的叙事逻辑，缩小了与美国顶尖闭源模型的差距。
AI的交付单位从一行代码变为完整项目，冲击了软件工程的生产关系。
GLM-5.1的出现引发了对人类不可替代性的思考，强调了定义问题和创造价值的能力。

🔎

延伸解读

长程任务能力的突破

智谱GLM-5.1在长程任务能力上取得的显著进展，标志着AI技术的一个新阶段。与传统模型相比，它能够在数小时内完成复杂的工程任务，这不仅提升了工作效率，也改变了软件开发的生产关系。AI的交付单位从单行代码转变为完整项目，意味着开发者需要重新审视自己的角色和技能。

中国开源AI的崛起

GLM-5.1的成功不仅是技术上的突破，更是中国开源AI在全球舞台上的崛起。它在多个权威评测中超越了国际顶尖模型，显示出中国在AI领域的竞争力。这一变化可能会推动更多企业和开发者关注和参与开源AI的发展，进一步促进技术创新和应用落地。

AI与人类工程师的关系

随着GLM-5.1等模型的出现，AI在软件开发中的角色正在发生变化。虽然AI能够完成复杂任务，但人类工程师的不可替代性仍然存在。未来，开发者需要具备驾驭AI的能力，专注于问题定义、价值创造和核心决策，这将是人类在AI时代的核心竞争力。

❓

延伸问答

智谱GLM-5.1模型的主要突破是什么？

智谱GLM-5.1在长程任务能力上取得显著突破，能够在14小时内优化CUDA Kernel，速度提升至35.7倍。

GLM-5.1如何在SWE-bench Pro测试中表现？

GLM-5.1在SWE-bench Pro测试中超越了Claude Opus 4.6和GPT-5.4等顶尖模型，获得全球第一。

GLM-5.1能在多长时间内构建MacOS环境？

GLM-5.1能够在1小时内从零构建MacOS桌面环境。

GLM-5.1在向量数据库优化方面的表现如何？

GLM-5.1通过655轮迭代将向量数据库的查询性能提升至21472 QPS，提升了6.9倍。

GLM-5.1的自主工作能力有哪些特点？

GLM-5.1展现了自主编程、测试和优化的能力，能够在长达8小时的任务中自主规划和执行。

GLM-5.1的出现对中国开源AI行业有什么影响？

GLM-5.1标志着中国开源AI的崛起，缩小了与美国顶尖闭源模型的差距，推动了行业变革。

🏷️