本文探讨了大型视觉语言模型中的幻觉问题,提出通过细粒度人工智能反馈和强化学习来减轻幻觉的方法,并引入了新的评估基准RAH-Bench,实验结果显示改进显著。此外,开发了GUICourse数据集,以提升图形用户界面代理人的性能,展示了在视觉问答和医学图像处理中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。