商汤开源 SenseNova-MARS,突破多模态搜索推理天花板
💡
原文中文,约2600字,阅读约需7分钟。
📝
内容提要
商汤开源的SenseNova-MARS模型在多模态搜索与推理中表现优异,得分69.74,超越Gemini-3-Pro和GPT-5.2。该模型支持动态视觉推理和图文搜索,具备自主规划和高效工具调用能力,推动AI实际应用。
🎯
关键要点
- 商汤开源的SenseNova-MARS模型在多模态搜索与推理中得分69.74,超越Gemini-3-Pro和GPT-5.2。
- SenseNova-MARS是首个支持动态视觉推理和图文搜索深度融合的Agentic VLM模型,具备自主规划和工具调用能力。
- 在多个基准测试中,SenseNova-MARS取得SOTA成绩,全面领先于顶级闭源模型。
- 模型在MMSearch和HR-MMSearch等评测中表现优异,尤其在细粒度视觉分析方面。
- SenseNova-MARS能够解决复杂的多步骤推理和多工具协作问题,提升工作效率。
- 模型采用因材施教的训练方法,通过自动化数据合成和强化学习来提升能力。
- 商汤全开源SenseNova-MARS模型、代码和数据集,支持Hugging Face下载。
➡️