量子位 ·

SuperCLUE多模态视觉评测榜：文心4.5 Turbo总分并列国内第一

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

SuperCLUE-VLM榜单显示，百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一，Gemini-2.5-Pro以74.99分领先，评测涵盖15款多模态模型，彰显中国在该领域的竞争力。

🎯

🔎

SuperCLUE-VLM评测围绕基础认知、视觉推理和视觉应用三大核心维度展开。这些维度不仅反映了模型在真实场景中的表现，也为开发者提供了明确的改进方向，尤其是在视觉推理和应用能力上，未来的研究和开发可以更加聚焦于这些高阶任务。

百度ERNIE-4.5-Turbo-VL与其他国际模型的比较显示，中国在多模态大模型领域的竞争力正在增强。尤其是文心大模型在视觉推理等方面的突出表现，表明国内企业在技术创新和应用落地方面的潜力，值得关注后续的发展动态。

百度开源的文心4.5系列模型为开发者提供了丰富的资源，促进了多模态技术的普及和应用。随着开发者数量的增加，未来可能会涌现出更多创新应用，推动整个行业的发展。关注这些开源模型的更新和社区反馈，将有助于把握行业趋势。

❓

SuperCLUE-VLM榜单显示，Gemini-2.5-Pro以74.99分领先，百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一，OpenAI GPT-5(high)以68.59分位居第二。

评测围绕基础认知、视觉推理和视觉应用三大核心维度进行。

分析人士指出，文心大模型在多模态领域的多维度领先优势突出，尤其在视觉推理和视觉应用等高阶任务上表现显著。

百度文心4.5系列模型具备复杂的图文与视频理解能力，支持超过100种语言交互，适用于文档处理、视频管理等核心任务场景。

评测涵盖了15款多模态模型，包括国内外多个知名模型。

百度依托全栈自研体系，持续推动文心大模型能力进化，显示出中国在多模态大模型领域的竞争潜力。

🏷️