智谱新模型也用DeepSeek的MLA,苹果M5就能跑

💡 原文中文,约1200字,阅读约需3分钟。
📝

内容提要

智谱AI推出新模型GLM-4.7-Flash,参数300亿,激活仅30亿,适用于本地编程和智能助手。该模型在代码修复测试中表现优异,支持200K上下文窗口,兼容多平台,并可在苹果M5上运行。API免费开放,具备创意写作和翻译功能。

🎯

关键要点

  • 智谱AI推出新模型GLM-4.7-Flash,参数300亿,激活仅30亿。 未点亮
  • 该模型适用于本地编程和智能助手,API免费开放调用。 未点亮
  • 在代码修复测试中,GLM-4.7-Flash表现优异,得分59.2。 未点亮
  • 模型支持200K上下文窗口,兼容多平台,可在苹果M5上运行。 未点亮
  • GLM-4.7-Flash采用混合专家架构,实际推理时仅激活约30亿参数。 未点亮
  • 首次采用MLA架构,提升了模型的效率。 未点亮
  • 支持本地部署,开发者在苹果笔记本上测试速度达到43 token/s。 未点亮
  • 基础版GLM-4.7-Flash完全免费,高速版价格低廉。 未点亮
  • 在上下文长度支持和输出token价格上具有优势,但延迟和吞吐量需优化。 未点亮