小红花·文摘

本文介绍了一种基于大型语言模型（LLM）的真实性检测方法，旨在提高文本的可靠性。研究通过高质量的真/假语句数据集，分析LLM对真实性的表示结构，发现其线性表示事实的真实性或虚假性。提出的质量均值推断法具有更好的推广性，并探讨了LLM的幻觉问题，提出自我评估和自对齐方法以增强事实准确性。

大型语言模型的内在表示与幻觉

BriefGPT - AI 论文速递 ·

本研究提出了一种自对齐的角色扮演方法Ditto，通过利用大规模训练语料库中的角色知识，将语言模型调整为模拟角色扮演对话。Ditto在多轮对话中展现出一致的角色身份和准确的角色特定知识，性能高于其他开源角色扮演基准，并与专有聊天机器人相媲美。同时，研究还发现大型语言模型自身的能力限制了角色特定知识的获取，但通过辅助较小模型的指导可以轻松获得角色扮演风格。

大规模语言模型是所有字符的叠加：通过自我对齐实现任意角色扮演

BriefGPT - AI 论文速递 ·