本研究提出HVSBench基准测试,以评估多模态大语言模型(MLLMs)与人类视觉系统的对齐程度。实验结果显示,现有顶尖模型在基本视觉任务上仍需改进,为MLLMs研究带来新挑战。
完成下面两步后,将自动完成登录并继续当前操作。