小红花·文摘

本研究提出了一种多频扰动（MFP）方法，旨在解决多模态大语言模型在视觉语言任务中的物体幻觉问题。该方法通过干扰视觉特征表示，显著减少幻觉现象，并在CHAIR基准测试中取得优异成绩。