我爱自然语言处理 ·

GLM-4.5：三体合一的开源智能体大模型，重新定义AI推理边界

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

GLM-4.5系列是一个追求通用人工智能的超级模型，具备智能体能力、复杂推理和编程能力。该模型采用MoE架构，参数达到3550亿，计算效率提升了3倍。在智能体、推理和编程能力方面表现出色，开源将加速AI应用的落地，标志着中国在AI领域的新里程碑。

🎯

🔎

GLM-4.5采用了MoE架构，参数量虽大，但通过稀疏激活技术实现了高效计算，提升了3倍的计算效率。这种设计使得模型在处理复杂任务时，能够在保证性能的同时，降低资源消耗，适合在多种环境中部署。

GLM-4.5的全开源将为开发者提供更多的创新空间，促进AI应用的快速落地。尤其是在智能体和编程能力方面，开源将使得更多企业和个人能够利用这一技术，推动行业的整体进步。

在智能体能力和推理能力的评估中，GLM-4.5表现优异，尤其是在复杂推理和编程任务中，准确率接近人类水平。这表明该模型在实际应用中，能够有效处理高难度任务，适用于教育、科研等多个领域。

❓

GLM-4.5模型具备智能体能力、复杂推理和编程能力，采用MoE架构，参数达到3550亿，计算效率提升3倍。

在TAU-Bench测试中，GLM-4.5的准确率达到79.7%，超越了Gemini 2.5 Pro。

在AIME 24国际数学竞赛题中，GLM-4.5的正确率为91.0%，接近人类奥赛选手水平。

在SWE-bench测试中，GLM-4.5的通过率为64.2%，在终端操作中超越Claude Sonnet 4。

GLM-4.5的全开源标志着中国在AI领域的新里程碑，将加速AI智能体的实际应用。

GLM-4.5采用三阶段锻造ARC铁三角，包括预训练数据革命、中训练和后训练专家蒸馏。

🏷️