💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
我们提出了SPACE基准,用于评估前沿模型的空间认知能力。该基准基于认知科学研究,考察大规模地图能力、小规模物体形状推理以及空间注意力和记忆等认知基础。结果表明,现代模型在空间智能方面的表现不及动物,且在经典动物认知测试中接近随机水平。
🎯
关键要点
- 提出了SPACE基准,用于评估前沿模型的空间认知能力。
- 该基准基于认知科学研究,考察大规模地图能力、小规模物体形状推理以及空间注意力和记忆等认知基础。
- 现代模型在空间智能方面的表现不及动物,且在经典动物认知测试中接近随机水平。
❓
延伸问答
SPACE基准的主要目的是什么?
SPACE基准旨在系统评估前沿模型的空间认知能力。
SPACE基准是基于什么研究建立的?
SPACE基准基于认知科学研究建立。
现代模型在空间智能方面的表现如何?
现代模型在空间智能方面的表现不及动物,接近随机水平。
SPACE基准评估哪些认知能力?
SPACE基准评估大规模地图能力、小规模物体形状推理以及空间注意力和记忆等认知基础。
SPACE基准如何进行评估?
SPACE基准通过文本和图像的平行呈现来评估模型的能力。
现代模型在经典动物认知测试中的表现如何?
现代模型在经典动物认知测试中表现接近随机水平。
➡️