通过实时验证和修正来减轻大型语言模型中的虚构问题
原文中文,约400字,阅读约需1分钟。发表于: 。我们介绍了一种名为 Ever 的新方法,通过实时检验和矫正策略,解决大语言模型生成的不准确或虚构内容的问题,并在各种任务中,包括短问题回答、传记生成和多跳推理等方面,相比基于检索和非检索的基准模型,明显提高了生成值得信赖和事实准确的文本的能力。
自然语言处理和大型语言模型取得进展,但存在幻觉问题。研究发现FLAN-T5-11B作为事实验证器表现最佳,超过GPT3.5和ChatGPT。研究为可信赖的生成模型提供见解。