爱范儿 ·

Claude Opus 4.6 一天之内被超越两次，这次来自国产模型

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

智谱的GLM-5.1模型在SWE-bench Pro上得分58.4%，超越Claude Opus 4.6和GPT-5.4，能够独立完成复杂任务如构建Linux系统，且成本显著降低。GLM-5.1开源，支持多种推理框架，标志着国产模型的进步。

🎯

关键要点

智谱的GLM-5.1模型在SWE-bench Pro上得分58.4%，超越Claude Opus 4.6和GPT-5.4。
GLM-5.1能够独立完成复杂任务，如从零构建Linux系统，且成本显著降低。
GLM-5.1开源，支持多种推理框架，标志着国产模型的进步。
GLM-5.1在技术细节上突破了以往模型的瓶颈，能够进行增量调优。
模型在优化过程中实现了显著的性能提升，如查询吞吐量提升6.9倍。
GLM-5.1的技术规格包括744B参数，使用华为昇腾910B芯片训练，成本降低97%。
开发者反馈GLM-5.1的推理速度相对较慢，复杂任务处理时间较长。
GLM-5.1的意义在于证明国产模型在算力受限的情况下仍能取得重要进展。

❓

延伸问答

GLM-5.1模型的主要优势是什么？

GLM-5.1模型在SWE-bench Pro上得分58.4%，超越了Claude Opus 4.6和GPT-5.4，能够独立完成复杂任务，且成本显著降低。

GLM-5.1是如何实现从零构建Linux系统的？

GLM-5.1能够在8小时内从零构建完整的Linux桌面系统，包括架构设计、代码编写、测试和修复bug，执行了1200多步。

GLM-5.1的训练成本相比于其他模型如何？

GLM-5.1的训练成本降低了97%，输入成本是Claude Opus的1/5，输出成本是1/8。

GLM-5.1的技术规格是什么？

GLM-5.1是744B参数的混合专家模型，使用华为昇腾910B芯片训练，支持长上下文能力，最大输出131,072 tokens。

GLM-5.1在推理速度上有什么不足？

GLM-5.1的推理速度为44.3 tokens/秒，复杂任务处理时间较长，可能需要一小时起步。

GLM-5.1的开源情况如何？

GLM-5.1是开源的，使用MIT许可证，支持多种推理框架，任何人都可以使用和修改。

🏷️

继续阅读

Avalonia UI 12.0.0 正式发布：架构演进和性能飞跃 - 张善友
Avalonia UI 12.0.0版本的发布标志着其跨平台框架的成熟，专注于稳定性和性能提升。该版本剥离了旧API，支持.NET 8及以上，优化了渲染引...
绿盟清风卫NSF-ClawGuard龙虾安全插件正式开源：为OpenClaw筑牢企业安全防线
绿盟科技推出NSF-ClawGuard插件，为OpenClaw等智能体提供安全防护。该插件通过静态扫描和运行时监控，实时拦截高危命令和恶意插件，确保智能体...
取代龙虾的是爱马仕？狂揽4万星的Hermes Agent，不只是OpenClaw平替
Hermes Agent 是一个开源的自我学习 AI 助手，能够随着使用时间不断提升。与 OpenClaw 不同，Hermes 通过闭合学习循环和记忆系统...
马斯克说漏嘴了！Claude Opus参数5T，Sonnet 1T
马斯克在推特上意外透露AI模型Claude的参数，Sonnet为1T，Opus为5T。Colossus 2超算正在训练多个模型，引发网友热议Claude系...
中国具身模型狂揽全球第一！机器人的人类数据时代来了
灵初智能推出10万小时人类数据集，凭借双系统架构Psi-R2和Psi-W0，推动机器人精细操作与失败经验学习，成为具身智能领域的领军者。开源策略促进数据采集与行业发展。
我所理解的Python元模型 - Artech
本文讨论了Python中的元类及其元模型，强调元类在类实例化过程中的重要性。通过类与元类的关系，解释了如何利用元类创建类，并探讨了Python对象的内存布...