智谱IPO敲钟前,连夜把开源编程大模型SOTA了

💡 原文中文,约2100字,阅读约需5分钟。
📝

内容提要

智谱AI推出开源编程大模型GLM-4.7,显著提升编码、推理和工具使用能力,超越GPT-5.1。该模型在复杂任务中表现优异,支持多种思考模式,提升用户体验。GLM-4.7是智谱IPO前的重要更新。

🎯

关键要点

  • 智谱AI推出开源编程大模型GLM-4.7,超越GPT-5.1。
  • GLM-4.7在复杂任务中表现优异,支持多种思考模式。
  • 模型在AIME 25和HLE基准中得分超越GPT-5.1。
  • SWE-Bench分数达到73.8%,创开源新高。
  • GLM-4.7在前端生成质量上有明显升级,页面结构更清晰。
  • 模型在编码能力、交互体验与复杂推理等方面实现系统性升级。
  • 引入交错式思考、保留式思考和轮级思考等新思考模式。
  • 保留式思考减少信息丢失,适用于长程复杂任务。
  • 轮级思考允许在会话中灵活控制推理计算,提升用户体验。
  • 智谱AI即将上市,GLM-4.7是其IPO前的重要更新。

延伸问答

GLM-4.7相比于GPT-5.1有哪些优势?

GLM-4.7在复杂任务中表现优异,AIME 25和HLE基准得分超越GPT-5.1,且在编码能力和工具使用能力上有显著提升。

GLM-4.7引入了哪些新思考模式?

GLM-4.7引入了交错式思考、保留式思考和轮级思考等新思考模式,提升了模型的推理和交互能力。

GLM-4.7在编码能力上有哪些具体提升?

GLM-4.7在编码能力上显著增强,支持多语言和终端任务,SWE-bench分数达到73.8%,比前代提升5.8%。

智谱AI的IPO与GLM-4.7有什么关系?

GLM-4.7是智谱AIIPO前的重要更新,展示了其技术实力,可能对上市产生积极影响。

GLM-4.7在用户体验方面有哪些改进?

GLM-4.7在前端生成质量上有明显升级,页面结构更清晰,交互体验更流畅,适用于多种应用场景。

GLM-4.7的SWE-Bench分数是多少?

GLM-4.7的SWE-Bench分数达到73.8%,创开源新高。

➡️

继续阅读