小红花·文摘

大视觉语言模型（LVLMs）在医学领域的幻觉测试中表现出较差的稳健性，引发了对这些特定领域模型可靠性的担忧。这项研究提供了评估这些模型的途径。

BriefGPT - AI 论文速递 ·

大视觉语言模型（LVLMs）在医学幻觉测试中表现出较差的稳健性，引发了对这些模型可靠性的担忧。医学LVLMs需要准确整合医学知识，并保持稳健的推理能力以防止幻觉。

BriefGPT - AI 论文速递 ·