MMMU-Pro:更强鲁棒性的多学科多模态理解基准

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

MMMU是一个新的基准,用于评估多模态模型在大规模跨学科任务上的表现。它包括11500个多模态问题,涵盖六个核心学科和30个学科和183个子领域。MMMU侧重于使用领域特定知识进行高级感知和推理,对14个模型进行了评估,结果显示有改进空间。MMMU将推动构建下一代多模态基础模型。

🎯

关键要点

  • MMMU是一个新的基准,用于评估多模态模型在跨学科任务上的表现。
  • MMMU包括11500个多模态问题,涵盖六个核心学科和183个子领域。
  • 这些问题涉及30种高度异质的图像类型,如图表、地图和化学结构。
  • MMMU侧重于使用领域特定知识进行高级感知和推理,挑战模型执行专家任务。
  • 对14个模型的评估显示,先进的GPT-4V仅达到56%的准确率,表明有改进空间。
  • MMMU将推动构建面向专家的下一代多模态基础模型。
➡️

继续阅读