小红花·文摘

本文介绍了M-HalDetect数据集及其在幻觉检测中的应用，分析了大型语言模型（LLM）在视觉问题回答中的幻觉问题。研究表明，现有模型在负面代词上的准确率低于10%，并提出了多种方法和数据集以减少幻觉现象，提升模型的鲁棒性和可靠性。