MMCR:科学论文中的跨源推理基准测试
📝
内容提要
本研究针对现有视觉语言模型在科学论文跨源推理能力的不足,提出了一个名为MMCR的高难度基准,旨在评估其在处理科学论文中来自不同信息源的推理能力。实验结果显示,现有模型在这一任务上表现不佳,最高模型仅获得48.55%的准确率,这表明开发能够有效利用跨源信息进行推理的视觉语言模型的迫切需求。
🏷️
标签
➡️