小红花·文摘

本研究探讨视觉语言模型（VLMs）在处理视觉和语言线索下的无知推断能力，发现模型对语言线索敏感，但在视觉线索的推断能力上表现较弱且不一致，指出VLM在语用推理方面存在困难，需进一步改进。