该论文研究了视觉语言预训练模型中的对象幻觉问题,提出了ObjMLM损失函数以减少幻觉现象。通过HA-DPO和VTI等新技术,显著提高了模型性能,降低了幻觉率,增强了视觉特征的稳定性。实验结果显示,这些方法在多个指标上超越了基线,推动了视觉语言模型的发展。
完成下面两步后,将自动完成登录并继续当前操作。