本研究探讨大型语言模型(LLMs)在重述和翻译任务中检测内在幻觉的能力。分析显示,不同模型在任务表现上存在差异,但在特定提示下表现一致,自然语言推理模型表现优异,表明LLM检测方法并非唯一选择。
本文讨论了幻觉的定义和分类,引用了Ziwei Ji的定义,幻觉文本的特点是流畅但背景知识错误。幻觉可分为内在幻觉和外在幻觉,以及事实性幻觉和忠实性幻觉。一些论文还讨论了幻觉与正确性和事实性的关系。
完成下面两步后,将自动完成登录并继续当前操作。