本研究针对医学大型视觉语言模型(Med-LVLMs)生成幻觉的问题,提出了MedHEval基准,评估幻觉的三种根本原因及其缓解策略。结果表明,现有策略效果有限,需要改进训练以提升模型的可靠性。
完成下面两步后,将自动完成登录并继续当前操作。