Exploring Visual Contrastive Decoding to Mitigate Hallucination Issues in Large Vision-Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨了大型视觉语言模型(LVLMs)在生成与视觉内容相关的响应时的幻觉问题。提出了一种通过改变视觉输入信息进行视觉对比解码的方法,并结合图像降采样和编辑,验证了其在不同基准上的有效性。
🎯
关键要点
- 大型视觉语言模型(LVLMs)在生成与视觉内容相关的响应时存在幻觉问题。
- 研究提出了一种通过改变视觉输入信息进行视觉对比解码的方法。
- 该方法结合图像降采样和编辑,形成了一种简单有效的对比样本组合方法。
- 研究验证了该方法在不同基准上的适用性和有效性。
➡️