本研究探讨了视觉语言模型在简单空间认知中的不足,开发了名为TableTest的基准数据集进行测试。结果表明,逻辑描述的微小变化显著影响模型表现,揭示了其在推理空间关系方面的局限性。
完成下面两步后,将自动完成登录并继续当前操作。