商汤“夺金”SuperCLUE-V多模态大模型基准10月榜单

💡 原文中文,约1300字,阅读约需3分钟。
📝

内容提要

商汤科技的SenseChat-Vision 5.5在SuperCLUE-V多模态大模型榜单中表现出色,特别是在数理逻辑推理能力上排名第一。该模型总分73.56分,超过了包括GPT-4o在内的其他模型。商汤科技通过创新使用合成高阶思维链数据提升推理能力,并计划继续研发先进技术。

🎯

关键要点

  • 商汤科技的SenseChat-Vision 5.5在SuperCLUE-V多模态大模型榜单中表现出色,排名第一。
  • 该模型总分73.56分,超越了包括GPT-4o在内的其他模型。
  • SenseChat-Vision 5.5在数理逻辑推理能力方面表现突出,特别是在图表推理和场景推理任务上。
  • SuperCLUE-V评估涵盖了11个多模态理解大模型,聚焦基础能力和应用能力。
  • 商汤科技董事长徐立博士提出三层架构(KRE)理论,强调推理能力的重要性。
  • 商汤科技通过合成高阶思维链数据提升推理能力,未来将继续研发先进技术。
➡️

继续阅读