本研究提出了一种心理测量框架,定义了五种基本空间能力,并对13种视觉语言模型进行了基准测试,结果显示其表现明显低于人类,为空间智能评估提供了工具和方法论基础。
该研究提出了Sparkle框架,旨在提升视觉语言模型在空间推理中的表现。通过微调基本空间能力,模型在综合空间任务中的表现显著改善,增强了空间问题解决能力。
完成下面两步后,将自动完成登录并继续当前操作。