负面目标存在评估(NOPE):衡量视觉 - 语言模型中的目标幻觉
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一种新型基准——基于视觉问题回答的负面对象存在评估(NOPE),用于评估视觉语言模型中的对象幻觉问题。研究发现,所有模型在负面代词上的准确率都低于10%,且词汇多样性、大范围的问题类型和与场景相关的对象会增加视觉语言模型中对象幻觉的风险。
🎯
关键要点
- 基于视觉问题回答的负面对象存在评估(NOPE)是一种新型基准。
- NOPE用于评估视觉语言模型中的对象幻觉问题。
- 研究发现所有模型在负面代词上的准确率均低于10%。
- 词汇多样性、大范围的问题类型和与场景相关的对象会增加对象幻觉的风险。
➡️