小红花·文摘

本研究针对医学大型视觉语言模型（Med-LVLMs）生成幻觉的问题，提出了MedHEval基准，评估幻觉的三种根本原因及其缓解策略。结果表明，现有策略效果有限，需要改进训练以提升模型的可靠性。