量子位 ·

李飞飞再出手，空间智能的ImageNet来了

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

李飞飞团队发布了ESI-Bench，这是一个用于评测具身空间智能的新基准。该基准要求AI主动探索以获取信息，研究显示当前AI在空间智能方面，尤其是主动探索和推理能力上仍存在不足。ESI-Bench包含3081个任务实例，覆盖人类核心空间认知能力，旨在提升AI的空间推理能力。

🎯

🔎

ESI-Bench强调AI在空间智能中的主动探索能力，表明仅依赖被动感知无法有效解决复杂任务。AI需要像人类一样，主动行动以获取信息，这一理念为未来AI的发展指明了方向。

尽管3D重建在理论上提供了更丰富的信息，但不完美的3D重建可能导致更大的误差，甚至比2D信息更糟。这提醒研究者在使用3D重建时需谨慎，确保重建质量。

当前AI模型在主动探索中表现出明显的元认知缺陷，无法有效评估信息的充分性。这一问题不仅影响模型的决策能力，也为AI的进一步发展提出了新的挑战，需加强对模型自我评估能力的研究。

❓

ESI-Bench旨在评测具身空间智能，特别是AI的主动探索和推理能力。

ESI-Bench要求AI主动探索，而传统评测通常只进行被动感知。

ESI-Bench包含3081个任务实例。

当前AI在主动探索和推理能力上仍存在不足。

感知-行动回路是指智能体必须主动行动以获取信息并做出判断的过程。

ESI-Bench的设计理念是智能体必须主动行动才能获取足够信息作答。

🏷️