本研究提出了一种基于拓扑的方法TOHA,用于检测大型语言模型中的幻觉现象。通过分析提示与响应的拓扑差异,发现特定注意力头的差异与幻觉输出相关,拓扑分析有效指示了模型的事实可靠性。
完成下面两步后,将自动完成登录并继续当前操作。