本研究提出了一种心理测量框架,定义了五种基本空间能力,并对13种视觉语言模型进行了基准测试,结果显示其表现明显低于人类,为空间智能评估提供了工具和方法论基础。
完成下面两步后,将自动完成登录并继续当前操作。