量子位 ·

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

智谱推出了新模型GLM-4.1V-9B-Thinking，参数仅9B，却在28项评测中获得23个SOTA，超越8倍参数模型。该模型采用思维链推理和课程采样强化学习，具备超长视频解析和智能读图问答能力，表现优异。

🎯

🔎

GLM-4.1V-9B-Thinking模型通过引入思维链推理和课程采样强化学习，显著提升了推理能力。这种创新使得模型在处理复杂任务时表现优异，尤其是在图文理解和逻辑推理方面，能够与更大参数模型相抗衡。

智谱在推出新模型的同时，获得了浦东创投集团和张江集团的10亿元投资。这不仅为模型的进一步发展提供了资金支持，也显示出市场对高效能AI模型的强烈需求，预示着未来在多模态AI领域的竞争将更加激烈。

GLM-4.1V-9B-Thinking的技术架构包括视觉编码器、多层感知机适配器和语言解码器，特别是采用三维卷积的视觉编码器，使得模型在视频处理上效率大幅提升。这种设计使得模型能够更好地适应复杂的输入数据，提升了整体性能。

❓

GLM-4.1V-9B-Thinking模型的参数量为9B。

该模型在28项评测中获得了23个SOTA，超越了8倍参数的模型。

该模型采用了思维链推理和课程采样强化学习技术。

它具备超长视频解析、智能读图问答、理科解题等多种能力。

训练过程包括预训练、监督微调和课程采样强化学习三个阶段。

浦东创投集团和张江集团对智谱进行了10亿元的投资。

🏷️