视觉语言模型在神经心理学测试中显示广泛的视觉缺陷
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究评估了视觉语言模型(VLMs)在基础视觉概念理解方面的不足,发现其在物体识别上表现良好,但在方向和位置等低中级视觉能力上存在显著缺陷。
🎯
关键要点
- 本研究评估了视觉语言模型(VLMs)在基础视觉概念理解上的不足。
- VLMs在物体识别任务中表现良好。
- 在方向、位置、连续性和遮挡等低中级视觉能力上存在显著缺陷。
- 研究通过51项评估填补了人工智能与人类视觉能力之间的差距。
- 人工系统能够实现复杂的物体识别,但未能掌握基础视觉概念。
➡️