💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
智谱推出GLM-4.6V系列多模态大模型,包括基础版和轻量版,支持128k tokens上下文窗口,具备原生工具调用能力,优化视觉理解。相比前代,价格降低50%,并提供免费轻量版。该模型在多模态任务中表现优异,开源资源已在主流社区发布,便于开发者集成。
🎯
关键要点
- 智谱推出GLM-4.6V系列多模态大模型,包括基础版和轻量版。
- 支持128k tokens上下文窗口,具备原生工具调用能力,优化视觉理解。
- 相比前代,GLM-4.6V系列价格降低50%,并提供免费轻量版。
- 模型在多模态任务中表现优异,开源资源已在主流社区发布。
- GLM-4.6V系列包括GLM-4.6V(106B-A12B)和GLM-4.6V-Flash(9B)。
- 模型原生支持多模态工具调用,减少信息损失和工程复杂度。
- GLM-4.6V在智能图文混排、视觉购物、文档与视频理解等场景中表现突出。
- 在多模态评测基准上,GLM-4.6V取得显著提升,表现超过同规模的其他模型。
- 开源资源包括模型权重、推理代码与在线调用能力,便于开发者集成。
➡️