VAQUUM:模糊量词是否建立在视觉数据基础上?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究探讨了模糊量词在视觉上下文中的有效性,填补了现有研究的空白。通过VAQUUM数据集,发现视觉语言模型在使用模糊量词时受对象数量的影响,各模型表现不一致,表明判断和生成依赖于不同的过程。
🎯
关键要点
- 本研究探讨了模糊量词在视觉上下文中的有效性与人类的兼容性。
- 研究填补了现有研究中的空白。
- 引入了一个包含20300个评分和1089张图像的新数据集VAQUUM。
- 发现视觉语言模型在使用模糊量词时受对象数量的影响。
- 不同评估设置下,各模型的表现存在显著不一致。
- 判断和生成模糊量词依赖于不同的过程。
➡️