小红花·文摘

本研究探讨了大型视觉语言模型（LVLMs）在生成与视觉内容相关的响应时的幻觉问题。提出了一种通过改变视觉输入信息进行视觉对比解码的方法，并结合图像降采样和编辑，验证了其在不同基准上的有效性。