MMMU是一个新的基准,用于评估多模态模型在大规模跨学科任务上的表现。它包括11500个多模态问题,涵盖六个核心学科和30个学科和183个子领域。MMMU侧重于使用领域特定知识进行高级感知和推理,对14个模型进行了评估,结果显示有改进空间。MMMU将推动构建下一代多模态基础模型。
MMMU是一个新的基准,用于评估多模态模型在大规模跨学科任务上的表现。它包含11500个多模态问题,涵盖六个核心学科和30个学科子领域。评估结果显示,即使是先进的GPT-4V也只能达到56%的准确率。MMMU有望推动下一代多模态基础模型的发展。
MMMU是一个新的基准,用于评估多模态模型在大规模跨学科任务上的表现。它包含11500个多模态问题,涵盖六个核心学科和30个学科和183个子领域。MMMU侧重于使用领域特定知识进行高级感知和推理,对14个开源LMM和专有的GPT-4V进行了评估。结果显示,即使是先进的GPT-4V也只能达到56%的准确率。MMMU将推动构建面向专家人工通用智能的下一代多模态基础模型。
完成下面两步后,将自动完成登录并继续当前操作。