GPT-4o不敌Qwen，无一模型及格！UC伯克利港大等提出多模态新基准

多视图理解推理有新的评判标准了

UC伯克利等机构提出了All-Angles Bench基准，用于评估多模态大语言模型的多视图理解能力。研究显示，现有模型如GPT-4o在多视图推理方面与人类水平存在显著差距，尤其在遮挡和相机位姿估计任务中表现不佳。该基准涵盖90个真实场景，包含2100组问答对，旨在推动多视图理解研究的进展。

gpt qwen 基准多模态多视图理解大语言模型推理