Micropaper ·

GLM-5：从「氛围编程」到「智能体工程」的范式跃迁

Q: GLM-5采用了什么样的学习架构？

GLM-5采用了异步强化学习基础设施。

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

GLM-5是智谱AI与清华大学联合推出的基础模型，拥有7440亿参数，采用异步强化学习，支持多种思维模式，适配中国芯片生态，基准测试表现优异，标志着AI领域的重大突破。

🎯

关键要点

GLM-5是智谱AI与清华大学联合推出的基础模型，拥有7440亿参数。
GLM-5采用DeepSeek Sparse Attention架构，实现了高效的参数规模。
GLM-5的异步强化学习基础设施提高了GPU利用率，支持大规模智能体轨迹探索。
GLM-5支持三种思维模式：交错思维、保留思维和轮次级思维。
GLM-5完全适配中国的GPU生态系统，降低了部署成本。
在基准测试中，GLM-5表现优异，成为首个达到50分的开源权重模型。
GLM-5在真实世界智能体工程评估中表现出色，构建成功率达到98.0%。
GLM-5曾以匿名身份在OpenRouter上发布，引起用户关注。
GLM-5代表了实用AI效用的范式转变，旨在探索智能体通用智能的前沿。

🔎

延伸解读

GLM-5的技术创新

GLM-5采用了DeepSeek Sparse Attention架构，显著提高了参数效率。与前代模型相比，虽然参数量翻倍，但激活参数量却保持在较低水平，这使得模型在处理复杂任务时更加高效。这样的技术创新不仅提升了模型的性能，也为未来的AI模型设计提供了新的思路。

适配中国芯片生态的优势

GLM-5完全适配中国的GPU生态系统，降低了部署成本并提升了性能。这一适配使得国内企业在使用该模型时能够更好地利用现有资源，减少对外部技术的依赖，推动了本土AI技术的发展。

多样化思维模式的实用性

GLM-5支持交错思维、保留思维和轮次级思维三种思维模式，能够根据不同场景灵活切换。这种多样化的思维方式使得模型在处理复杂对话和任务时更加智能化，提升了用户体验和应用的广泛性。

❓

延伸问答

GLM-5的参数规模有多大？

GLM-5拥有7440亿参数。

GLM-5采用了什么样的学习架构？

GLM-5采用了异步强化学习基础设施。

GLM-5支持哪些思维模式？

GLM-5支持交错思维、保留思维和轮次级思维三种思维模式。

GLM-5在基准测试中的表现如何？

GLM-5在基准测试中表现优异，成为首个达到50分的开源权重模型。

GLM-5如何适配中国的芯片生态？

GLM-5完全适配中国的GPU生态系统，降低了部署成本。

GLM-5的发布引起了怎样的反响？

GLM-5曾以匿名身份在OpenRouter上发布，引起用户关注。

🏷️