大视觉语言模型(LVLMs)在医学领域的幻觉测试中表现出较差的稳健性,引发了对这些特定领域模型可靠性的担忧。这项研究提供了评估这些模型的途径。
大视觉语言模型(LVLMs)在医学幻觉测试中表现出较差的稳健性,引发了对这些模型可靠性的担忧。医学LVLMs需要准确整合医学知识,并保持稳健的推理能力以防止幻觉。
完成下面两步后,将自动完成登录并继续当前操作。