SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
SuperCLUE-VLM榜单显示,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,Gemini-2.5-Pro以74.99分领先,评测涵盖15款多模态模型,彰显中国在该领域的竞争力。
🎯
关键要点
- SuperCLUE-VLM榜单显示,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一。
- Gemini-2.5-Pro以74.99分领先,OpenAI GPT-5(high)以68.59分位居第二。
- 评测涵盖15款多模态模型,基于中文场景特点进行评估。
- 评测围绕基础认知、视觉推理和视觉应用三大核心维度进行。
- 分析人士指出,文心大模型在多模态领域的多维度领先优势突出。
- 百度开源文心4.5系列10款模型,具备复杂的图文与视频理解能力。
- 百度依托全栈自研体系,持续推动文心大模型能力进化。
- 截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业。
❓
延伸问答
SuperCLUE-VLM榜单的评测结果如何?
SuperCLUE-VLM榜单显示,Gemini-2.5-Pro以74.99分领先,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,OpenAI GPT-5(high)以68.59分位居第二。
SuperCLUE-VLM评测的核心维度是什么?
评测围绕基础认知、视觉推理和视觉应用三大核心维度进行。
百度ERNIE-4.5-Turbo-VL的优势是什么?
分析人士指出,文心大模型在多模态领域的多维度领先优势突出,尤其在视觉推理和视觉应用等高阶任务上表现显著。
百度文心4.5系列模型的特点是什么?
百度文心4.5系列模型具备复杂的图文与视频理解能力,支持超过100种语言交互,适用于文档处理、视频管理等核心任务场景。
SuperCLUE-VLM评测涵盖了多少款模型?
评测涵盖了15款多模态模型,包括国内外多个知名模型。
百度在多模态大模型领域的竞争力如何?
百度依托全栈自研体系,持续推动文心大模型能力进化,显示出中国在多模态大模型领域的竞争潜力。
➡️