小红花·文摘

本研究提出了一种基于拓扑的方法TOHA，用于检测大型语言模型中的幻觉现象。通过分析提示与响应的拓扑差异，发现特定注意力头的差异与幻觉输出相关，拓扑分析有效指示了模型的事实可靠性。