💡 原文中文,约1200字,阅读约需3分钟。
📝

内容提要

智谱发布并开源GLM-5模型,参数规模达到7440亿,显著提升复杂系统工程和长时域智能体任务的性能。GLM-5在多项基准测试中优于其他开源模型,缩小与前沿模型的差距,支持MIT许可证,任何人均可使用。

🎯

关键要点

  • 智谱发布并开源GLM-5模型,参数规模达到7440亿。
  • GLM-5旨在应对复杂系统工程和长时域智能体任务。
  • 与GLM-4.5相比,GLM-5的参数规模从3550亿扩展到7440亿,预训练数据量增加到28.5万亿个token。
  • GLM-5集成了稀疏注意力机制,降低部署成本,同时保持长时域上下文处理能力。
  • 智谱开发了名为slime的新型异步强化学习基础设施,提高训练效率。
  • GLM-5在众多学术基准测试中表现优异,推理、编码和智能体任务上取得最佳性能。
  • 在Vending Bench 2基准测试中,GLM-5的最终账户余额为4432美元,展现强大的长期规划能力。
  • GLM-5系列模型已在HuggingFace和ModelScope上开源,模型权重以MIT许可证发布。
➡️

继续阅读