我们提出了SPACE基准,用于评估前沿模型的空间认知能力。该基准基于认知科学研究,考察大规模地图能力、小规模物体形状推理以及空间注意力和记忆等认知基础。结果表明,现代模型在空间智能方面的表现不及动物,且在经典动物认知测试中接近随机水平。
通用人工智能已经到来,前沿模型可以完成各种任务,但对其能力存在争议。
OpenAI、Anthropic、谷歌和微软联合任命Chris Meserole为前沿模型论坛首任执行董事,并成立超过1000万美元的AI安全基金,以推动AI安全研究,确保前沿AI模型的安全与负责任发展。
完成下面两步后,将自动完成登录并继续当前操作。