小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种心理测量框架，定义了五种基本空间能力，并对13种视觉语言模型进行了基准测试，结果显示其表现明显低于人类，为空间智能评估提供了工具和方法论基础。

定义和评估视觉语言模型的基本空间能力：来自心理测量学的视角

BriefGPT - AI 论文速递 ·

该研究提出了Sparkle框架，旨在提升视觉语言模型在空间推理中的表现。通过微调基本空间能力，模型在综合空间任务中的表现显著改善，增强了空间问题解决能力。

Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models to Enhance Composite Spatial Reasoning

BriefGPT - AI 论文速递 ·