探究大型视觉语言模型中的知觉恒常性
📝
内容提要
本研究解决了视觉语言模型(VLMs)在知觉恒常性方面的能力是否得以掌握的不足。通过对33个VLM进行253项实验,针对色彩、大小和形状恒常性,发现模型在形状恒常性表现与色彩和大小恒常性表现存在显著差异。这一发现为理解VLMs在动态视觉环境中的应用提供了重要洞见。
🏷️
标签
➡️