本文介绍了一种基于大型语言模型(LLM)的真实性检测方法,旨在提高文本的可靠性。研究通过高质量的真/假语句数据集,分析LLM对真实性的表示结构,发现其线性表示事实的真实性或虚假性。提出的质量均值推断法具有更好的推广性,并探讨了LLM的幻觉问题,提出自我评估和自对齐方法以增强事实准确性。
本研究提出了一种自对齐的角色扮演方法Ditto,通过利用大规模训练语料库中的角色知识,将语言模型调整为模拟角色扮演对话。Ditto在多轮对话中展现出一致的角色身份和准确的角色特定知识,性能高于其他开源角色扮演基准,并与专有聊天机器人相媲美。同时,研究还发现大型语言模型自身的能力限制了角色特定知识的获取,但通过辅助较小模型的指导可以轻松获得角色扮演风格。
完成下面两步后,将自动完成登录并继续当前操作。