本研究探讨视觉语言模型(VLMs)在处理视觉和语言线索下的无知推断能力,发现模型对语言线索敏感,但在视觉线索的推断能力上表现较弱且不一致,指出VLM在语用推理方面存在困难,需进一步改进。
完成下面两步后,将自动完成登录并继续当前操作。