研究人员提出了一种名为RITUAL的方法,用于增强大型视觉语言模型对幻觉的鲁棒性。该方法通过随机图像变换减少模型产生幻觉性输出的可能性。实验证明,RITUAL在多个物体幻觉基准数据集上优于现有的对比解码方法。
研究人员提出了一种名为RITUAL的方法,用于增强大型视觉语言模型(LVLMs)对幻觉的鲁棒性。该方法利用随机图像变换减少了幻觉性视觉解释的可能性。实验证明,RITUAL在多个物体幻觉基准数据集上优于现有的对比解码方法。
研究人员提出了一种名为RITUAL的方法,用于增强大型视觉语言模型(LVLMs)对幻觉的鲁棒性。该方法通过随机图像变换减少LVLMs产生与视觉信息不符的“幻觉性”输出的可能性。实验证明,RITUAL在多个物体幻觉基准数据集上优于现有的对比解码方法。
完成下面两步后,将自动完成登录并继续当前操作。