商汤“夺金”SuperCLUE-V多模态大模型基准10月榜单
💡
原文中文,约1300字,阅读约需3分钟。
📝
内容提要
商汤科技的SenseChat-Vision 5.5在SuperCLUE-V多模态大模型榜单中表现出色,特别是在数理逻辑推理能力上排名第一。该模型总分73.56分,超过了包括GPT-4o在内的其他模型。商汤科技通过创新使用合成高阶思维链数据提升推理能力,并计划继续研发先进技术。
🎯
关键要点
- 商汤科技的SenseChat-Vision 5.5在SuperCLUE-V多模态大模型榜单中表现出色,排名第一。
- 该模型总分73.56分,超越了包括GPT-4o在内的其他模型。
- SenseChat-Vision 5.5在数理逻辑推理能力方面表现突出,特别是在图表推理和场景推理任务上。
- SuperCLUE-V评估涵盖了11个多模态理解大模型,聚焦基础能力和应用能力。
- 商汤科技董事长徐立博士提出三层架构(KRE)理论,强调推理能力的重要性。
- 商汤科技通过合成高阶思维链数据提升推理能力,未来将继续研发先进技术。
🏷️
标签
➡️