小红花·文摘

本研究提出H-POPE评估基准，系统评估大型视觉语言模型中的幻觉问题，特别是对象存在性和细粒度属性的幻觉现象。结果表明，模型在这些方面易发生幻觉，揭示了其对视觉输入的依赖性。