SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一

💡 原文中文,约1000字,阅读约需3分钟。
📝

内容提要

SuperCLUE-VLM榜单显示,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,Gemini-2.5-Pro以74.99分领先,评测涵盖15款多模态模型,彰显中国在该领域的竞争力。

🎯

关键要点

  • SuperCLUE-VLM榜单显示,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一。
  • Gemini-2.5-Pro以74.99分领先,OpenAI GPT-5(high)以68.59分位居第二。
  • 评测涵盖15款多模态模型,基于中文场景特点进行评估。
  • 评测围绕基础认知、视觉推理和视觉应用三大核心维度进行。
  • 分析人士指出,文心大模型在多模态领域的多维度领先优势突出。
  • 百度开源文心4.5系列10款模型,具备复杂的图文与视频理解能力。
  • 百度依托全栈自研体系,持续推动文心大模型能力进化。
  • 截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业。

延伸问答

SuperCLUE-VLM榜单的评测结果如何?

SuperCLUE-VLM榜单显示,Gemini-2.5-Pro以74.99分领先,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,OpenAI GPT-5(high)以68.59分位居第二。

SuperCLUE-VLM评测的核心维度是什么?

评测围绕基础认知、视觉推理和视觉应用三大核心维度进行。

百度ERNIE-4.5-Turbo-VL的优势是什么?

分析人士指出,文心大模型在多模态领域的多维度领先优势突出,尤其在视觉推理和视觉应用等高阶任务上表现显著。

百度文心4.5系列模型的特点是什么?

百度文心4.5系列模型具备复杂的图文与视频理解能力,支持超过100种语言交互,适用于文档处理、视频管理等核心任务场景。

SuperCLUE-VLM评测涵盖了多少款模型?

评测涵盖了15款多模态模型,包括国内外多个知名模型。

百度在多模态大模型领域的竞争力如何?

百度依托全栈自研体系,持续推动文心大模型能力进化,显示出中国在多模态大模型领域的竞争潜力。

➡️

继续阅读