GLM-4.5发布,具备强大的推理、编码和智能代理能力

GLM-4.5发布,具备强大的推理、编码和智能代理能力

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

Zhipu AI发布了GLM-4.5和GLM-4.5-Air两款新AI模型,分别拥有355B和106B参数,采用混合专家架构,优化为“思考”和“非思考”模式。GLM-4.5在编码基准测试中表现优异,成功率达到90.6%。

🎯

关键要点

  • Zhipu AI发布了GLM-4.5和GLM-4.5-Air两款新AI模型,分别拥有355B和106B参数。
  • 这两款模型采用混合专家架构,优化为“思考”和“非思考”模式。
  • GLM-4.5在编码基准测试中表现优异,成功率达到90.6%。
  • GLM-4.5的架构优先考虑深度而非宽度,使用每层96个注意力头。
  • 训练使用了22T-token的语料库,其中7T-token专注于代码和推理。
  • GLM-4.5在12个基准测试中排名第三,仅次于OpenAI和Anthropic的顶级模型。
  • GLM-4.5-Air排名第六,超越了许多相似或更大规模的模型。
  • GLM-4.5在编码基准测试中表现突出,SWE-bench Verified得分64.2%。
  • 早期测试者对GLM-4.5的编码和代理能力给予了高度评价。
  • GLM-4.5可以通过Z.ai直接访问,或集成到现有的编码代理中。

延伸问答

GLM-4.5和GLM-4.5-Air有什么区别?

GLM-4.5拥有355B参数,而GLM-4.5-Air则有106B参数,前者适合复杂推理,后者更轻便。

GLM-4.5在编码基准测试中的表现如何?

GLM-4.5在编码基准测试中成功率达到90.6%,在SWE-bench Verified中得分64.2%。

GLM-4.5的架构特点是什么?

GLM-4.5的架构优先考虑深度,使用每层96个注意力头,并采用混合专家架构。

GLM-4.5的训练数据来源是什么?

GLM-4.5的训练使用了22T-token的语料库,其中7T-token专注于代码和推理。

GLM-4.5的应用场景有哪些?

GLM-4.5适用于编码、推理和智能代理任务,可以通过Z.ai直接访问或集成到现有编码代理中。

GLM-4.5和其他模型相比的排名如何?

GLM-4.5在12个基准测试中排名第三,仅次于OpenAI和Anthropic的顶级模型。

➡️

继续阅读