💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

IBM推出Granite 3.2多模态推理模型,具备链式推理能力和新视觉语言模型,显著提升性能。该模型支持灵活推理选项,采用推理缩放技术,增强数学推理基准表现。此外,Granite Guardian 3.2风险检测和时间序列模型专为企业需求设计。

🎯

关键要点

  • IBM推出Granite 3.2多模态推理模型,具备链式推理能力,显著提升性能。
  • Granite 3.2的8B和2B版本在推理能力上超越了3.1版本,支持根据任务灵活开启或关闭推理选项。
  • IBM采用推理缩放技术,通过生成多个答案并选择最佳答案来增强推理能力。
  • Granite 3.2在MATH500和AIME2024数学推理基准测试中表现优异,超越了更大的模型如GPT-4o-0513和Claude3.5-Sonnet-1022。
  • Granite Vision 3.2 2B是专为文档理解设计的新视觉语言模型,能够在企业基准测试中与更大模型竞争。
  • Granite Guardian 3.2是风险检测模型,提供更快的性能和更低的推理成本,引入了口头信心的新特性。
  • Granite 3.2新增时间序列模型,支持每周和每日预测,TTM-R2模型在点预测准确性上表现最佳。
  • IBM的TTM模型在参数数量上相对较小,但在特定任务上可能更具优势,特别是针对企业需求。
  • 所有Granite模型均在Apache 2.0许可证下发布,并可在多个平台上获取。
➡️

继续阅读