本研究分析了大型视觉语言模型(LVLMs)中的幻觉现象,提出了一种新的注意力修改方法,结合选择性标记和头部特异性调节,以减少生成与输入图像不符的描述。实验结果表明,该方法能将幻觉率降低62.3%,同时保持任务表现。
本文提出了一种名为SLPT的框架,用于使用深度学习进行医学图像分析。该框架通过选择性标记和提示调整相结合,提高有限标签下的性能。通过仅使用有限标记数据对预训练模型参数进行更新,同时保持模型不变。该框架包括特征感知提示更新器和基于提示的无监督多样性选择和有监督选择。在肝肿瘤分割任务中,该方法仅使用了可调参数的6%,标记了5%的数据即可达到全数据性能的94%。
完成下面两步后,将自动完成登录并继续当前操作。