本研究提出H-POPE评估基准,系统评估大型视觉语言模型中的幻觉问题,特别是对象存在性和细粒度属性的幻觉现象。结果表明,模型在这些方面易发生幻觉,揭示了其对视觉输入的依赖性。
完成下面两步后,将自动完成登录并继续当前操作。