本文介绍了M-HalDetect数据集及其在幻觉检测中的应用,分析了大型语言模型(LLM)在视觉问题回答中的幻觉问题。研究表明,现有模型在负面代词上的准确率低于10%,并提出了多种方法和数据集以减少幻觉现象,提升模型的鲁棒性和可靠性。
完成下面两步后,将自动完成登录并继续当前操作。