小红花·文摘

浙江大学等团队提出了ViewSpatial-Bench基准，用于评估视觉语言模型的空间推理能力。该基准包含5700个问答对，涵盖多视角任务，显示当前模型在空间理解方面的不足。研究开发的MVSM模型在性能上显著提升，推动AI系统向类人空间认知能力发展。

5700问答对全面评估拷问AI空间感！最新空间智能评测基准来了丨浙大&成电&港中文

量子位 ·

本研究探讨了视觉语言模型在简单空间认知中的不足，开发了名为TableTest的基准数据集进行测试。结果表明，逻辑描述的微小变化显著影响模型表现，揭示了其在推理空间关系方面的局限性。

Vision Language Models Are Unreliable in Simple Spatial Cognition

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型（LLM）在导航和城市规划等领域的空间智能应用，分析人类空间认知与推理的关系，提出从空间记忆到推理的整体框架，促进跨学科研究。

Cross-Scale Research on Spatial Intelligence Based on Large Language Models: Advances in Embodied Intelligence, Smart Cities, and Earth Sciences

BriefGPT - AI 论文速递 ·

群核科技在GTC2025大会上开源了空间理解模型SpatialLM，旨在提升机器的空间认知能力。该模型基于大语言模型，能够从视频生成3D场景布局，支持自然语言描述和场景交互。SpatialLM为具身智能领域提供基础训练框架，降低训练门槛，并与空间智能平台SpatialVerse协同，推动数字仿真与物理现实的结合。

5700问答对全面评估拷问AI空间感！最新空间智能评测基准来了丨浙大&成电&港中文

Vision Language Models Are Unreliable in Simple Spatial Cognition

Cross-Scale Research on Spatial Intelligence Based on Large Language Models: Advances in Embodied Intelligence, Smart Cities, and Earth Sciences

1段视频=亿万虚拟场景！群核开源空间理解多模态模型，真实世界秒变机器人训练场

1段视频=亿万虚拟场景，当真实世界秒变机器人训练场

前沿模型中的空间认知是否会出现？