BriefGPT - AI 论文速递 ·

MMMU-Pro：更强鲁棒性的多学科多模态理解基准

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了MMMU基准，旨在评估多模态模型在大学级学科知识和复杂跨学科任务上的表现。MMMU包含11500个多模态问题，涵盖六个核心学科，强调领域特定知识的高级推理能力。评估结果显示，先进模型如GPT-4V的准确率仅为56%，表明改进空间巨大，推动专家级人工智能的下一代多模态基础模型的发展。

🎯

❓

MMMU基准旨在评估多模态模型在大学级学科知识和复杂跨学科任务上的表现。

MMMU基准包含11500个多模态问题。

MMMU基准涵盖六个核心学科：艺术与设计、商业、科学、健康与医药、人文社会科学和技术与工程学。

评估结果显示，先进模型如GPT-4V的准确率仅为56%，表明改进空间巨大。

MMMU基准强调使用领域特定知识进行高级推理，挑战模型执行类似于专家的任务。

MMMU的目标是推动专家级人工智能的下一代多模态基础模型的发展。

🏷️