机器之心 ·

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

💡 原文中文，约16800字，阅读约需40分钟。

📝

内容提要

OpenAI的安全系统团队负责人Lilian Weng介绍了近年来在理解、检测和克服大型语言模型（LLM）幻觉方面的研究成果。研究者提出了多种方法，包括幻觉检测、基于采样的检测、对未知知识进行校准、间接查询和反幻觉方法。微调模型也被用于提升事实性和减少幻觉。这些研究对于改进大型语言模型的可靠性和准确性具有重要意义。

🎯

关键要点

OpenAI安全系统团队负责人Lilian Weng介绍了大型语言模型（LLM）幻觉的研究成果。
幻觉是指模型生成不真实或虚构的内容，分为上下文幻觉和外源性幻觉。
外源性幻觉关注模型输出与预训练数据集的事实一致性。
幻觉产生的原因包括预训练数据问题和微调新知识的引入。
微调新知识可能导致模型更倾向于产生幻觉。
幻觉检测方法包括检索增强式评估、基于采样的检测和对未知知识的校准。
反幻觉方法包括检索增强式生成（RAG）、动作链和针对事实性进行微调。
评估基准包括TruthfulQA、FactualityPrompt和SelfAware等。
使用检索和编辑的方法可以提高模型的事实性和减少幻觉。
模型的输出应当在事实性和长篇内容上都达到理想水平。

❓

延伸问答

什么是大型语言模型的幻觉？

大型语言模型的幻觉是指模型生成不真实、虚构或不一致的内容，通常分为上下文幻觉和外源性幻觉。

幻觉产生的主要原因是什么？

幻觉产生的原因包括预训练数据的问题和微调新知识的引入，这可能导致模型更倾向于产生幻觉。

有哪些方法可以检测大型语言模型的幻觉？

幻觉检测方法包括检索增强式评估、基于采样的检测和对未知知识的校准等。

如何通过微调来减少模型的幻觉？

通过微调模型以提升其事实性和减少幻觉，特别是针对归因和事实性的微调方法。

反幻觉方法有哪些？

反幻觉方法包括检索增强式生成（RAG）、动作链和针对事实性进行微调等。

评估大型语言模型幻觉的基准有哪些？

评估基准包括TruthfulQA、FactualityPrompt和SelfAware等，这些基准用于测量模型生成的事实性和诚实性。

🏷️

继续阅读

eBay拒绝游戏驿站560亿美元收购提案；OpenAI收购Tomoro并成立新实体；腾讯音乐完成收购喜马拉雅
OpenAI收购咨询公司Tomoro，成立新合资企业以推动人工智能应用。优步提高对Delivery Hero的收购报价。阳狮集团以22亿美元收购LiveR...
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
2026 06 05 HackerNews
特德·姜批评将人工智能拟人化，指出大型语言模型（LLM）并不具备意识或情感。加州大学伯克利分校因学生过度依赖AI，计算机科学课程的不及格率显著上升。美国政...
自主代理面临的最大挑战：数据库。
大型语言模型正在从简单的聊天机器人发展为能够推理和行动的自主代理，但数据库优化的复杂性仍是主要挑战。卡内基梅隆大学的安迪·帕夫洛指出，AI在数据库领域的影...
姚顺雨首度公开回应：为什么离开OpenAI加入腾讯？
2026腾讯云AI产业大会在北京举行，姚顺雨首次公开露面，分享了他对AI下半场的看法。他强调AI的核心在于寻找问题，而非技术本身，并指出腾讯的产品环境和组...
使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...