商汤开源 SenseNova-MARS,突破多模态搜索推理天花板

💡 原文中文,约2600字,阅读约需7分钟。
📝

内容提要

商汤开源的SenseNova-MARS模型在多模态搜索与推理中表现优异,得分69.74,超越Gemini-3-Pro和GPT-5.2。该模型支持动态视觉推理和图文搜索,具备自主规划和高效工具调用能力,推动AI实际应用。

🎯

关键要点

  • 商汤开源的SenseNova-MARS模型在多模态搜索与推理中得分69.74,超越Gemini-3-Pro和GPT-5.2。
  • SenseNova-MARS是首个支持动态视觉推理和图文搜索深度融合的Agentic VLM模型,具备自主规划和工具调用能力。
  • 在多个基准测试中,SenseNova-MARS取得SOTA成绩,全面领先于顶级闭源模型。
  • 模型在MMSearch和HR-MMSearch等评测中表现优异,尤其在细粒度视觉分析方面。
  • SenseNova-MARS能够解决复杂的多步骤推理和多工具协作问题,提升工作效率。
  • 模型采用因材施教的训练方法,通过自动化数据合成和强化学习来提升能力。
  • 商汤全开源SenseNova-MARS模型、代码和数据集,支持Hugging Face下载。

延伸问答

SenseNova-MARS模型的主要特点是什么?

SenseNova-MARS模型支持动态视觉推理和图文搜索深度融合,具备自主规划和工具调用能力。

SenseNova-MARS在多模态搜索中的表现如何?

SenseNova-MARS在多模态搜索与推理的基准测试中得分69.74,超越Gemini-3-Pro和GPT-5.2,表现优异。

SenseNova-MARS如何解决复杂的多步骤推理问题?

SenseNova-MARS能够自主调用多种工具,完成复杂的多步骤推理任务,如识别细节、查询信息等。

SenseNova-MARS的训练方法是什么?

SenseNova-MARS采用因材施教的训练方法,通过自动化数据合成和强化学习来提升能力。

SenseNova-MARS在图文搜索评测中的得分如何?

在MMSearch评测中,SenseNova-MARS以74.27分登顶,显著超越GPT-5.2的66.08分。

如何获取SenseNova-MARS模型及其代码?

SenseNova-MARS模型、代码和数据集全开源,支持在Hugging Face上下载。

➡️

继续阅读