💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
Zhipu AI发布了GLM-4.5和GLM-4.5-Air两款新AI模型,分别拥有355B和106B参数,采用混合专家架构,优化为“思考”和“非思考”模式。GLM-4.5在编码基准测试中表现优异,成功率达到90.6%。
🎯
关键要点
- Zhipu AI发布了GLM-4.5和GLM-4.5-Air两款新AI模型,分别拥有355B和106B参数。
- 这两款模型采用混合专家架构,优化为“思考”和“非思考”模式。
- GLM-4.5在编码基准测试中表现优异,成功率达到90.6%。
- GLM-4.5的架构优先考虑深度而非宽度,使用每层96个注意力头。
- 训练使用了22T-token的语料库,其中7T-token专注于代码和推理。
- GLM-4.5在12个基准测试中排名第三,仅次于OpenAI和Anthropic的顶级模型。
- GLM-4.5-Air排名第六,超越了许多相似或更大规模的模型。
- GLM-4.5在编码基准测试中表现突出,SWE-bench Verified得分64.2%。
- 早期测试者对GLM-4.5的编码和代理能力给予了高度评价。
- GLM-4.5可以通过Z.ai直接访问,或集成到现有的编码代理中。
❓
延伸问答
GLM-4.5和GLM-4.5-Air有什么区别?
GLM-4.5拥有355B参数,而GLM-4.5-Air则有106B参数,前者适合复杂推理,后者更轻便。
GLM-4.5在编码基准测试中的表现如何?
GLM-4.5在编码基准测试中成功率达到90.6%,在SWE-bench Verified中得分64.2%。
GLM-4.5的架构特点是什么?
GLM-4.5的架构优先考虑深度,使用每层96个注意力头,并采用混合专家架构。
GLM-4.5的训练数据来源是什么?
GLM-4.5的训练使用了22T-token的语料库,其中7T-token专注于代码和推理。
GLM-4.5的应用场景有哪些?
GLM-4.5适用于编码、推理和智能代理任务,可以通过Z.ai直接访问或集成到现有编码代理中。
GLM-4.5和其他模型相比的排名如何?
GLM-4.5在12个基准测试中排名第三,仅次于OpenAI和Anthropic的顶级模型。
➡️