本研究探讨了大型视觉语言模型(LVLMs)在生成与视觉内容相关的响应时的幻觉问题。提出了一种通过改变视觉输入信息进行视觉对比解码的方法,并结合图像降采样和编辑,验证了其在不同基准上的有效性。
完成下面两步后,将自动完成登录并继续当前操作。