小红花·文摘

本文探讨了大型视觉语言模型中的幻觉问题，提出通过细粒度人工智能反馈和强化学习来减轻幻觉的方法，并引入了新的评估基准RAH-Bench，实验结果显示改进显著。此外，开发了GUICourse数据集，以提升图形用户界面代理人的性能，展示了在视觉问答和医学图像处理中的应用潜力。