小红花·文摘

本研究提出了一种视觉放大融合（VAF）方法，旨在解决多模态大型语言模型中的物体幻觉问题。实验结果表明，VAF有效降低了幻觉的发生，同时保持了生成内容的连贯性和准确性。