奇迹:空间感知、推理与智能的多模态基准

📝

内容提要

本研究解决了现有计算机视觉基准在物体属性识别和空间关系推理方面的显著不足,提出了多模态基准MIRAGE,以评估模型在计数、关系和计数与关系推理中的能力。MIRAGE通过复杂场景强调了当前模型的关键局限性,指出了改善表示和推理框架的必要性,为未来时空推理研究提供了新方案。

➡️

继续阅读