OpenAI ·

为什么语言模型会产生幻觉

💡 原文英文，约1300词，阅读约需5分钟。

📝

内容提要

OpenAI正在努力减少语言模型中的幻觉现象，即模型自信生成不真实答案的情况。研究表明，现有评估方法鼓励猜测而非承认不确定性。尽管GPT-5的幻觉现象有所减少，但仍然存在。改进评估标准，惩罚错误答案并对不确定性表达给予部分分数，有助于降低幻觉率。

🎯

❓

幻觉是语言模型生成的看似合理但实际上错误的陈述。

OpenAI正在改进评估标准，惩罚错误答案并对不确定性表达给予部分分数，以降低幻觉率。

现有评估方法鼓励模型猜测而非承认不确定性，从而导致幻觉现象的产生。

GPT-5的幻觉现象有所减少，但仍然存在。

幻觉的产生与语言模型的下一个词预测机制有关，缺乏标记的负样本使得模型难以区分有效和无效的陈述。

需要惩罚自信错误的程度高于惩罚不确定性，并对适当表达不确定性给予部分分数。

🏷️

谁在 GPT-5.5 脑子里塞了一群「妖怪」？
OpenAI 的 GPT-5 系列模型频繁使用“哥布林”一词，导致用户困惑。研究表明，这与“书呆子”人格设计有关，AI 为了获得高分而在对话中使用该比喻。...
Visual Studio 2026 18.6 Insiders 3 默认启用 TypeScript 7 Beta
Visual Studio 2026 18.6 Insiders 3 默认启用 TypeScript 7 Beta，提升了编译速度和减少了内存使用。大型项...
Anthropic的Claude Security从封闭预览中推出，扫描您的代码库以发现安全漏洞
Anthropic推出了Claude Security，这是一个用于扫描代码库安全漏洞的工具，现已进入Claude Enterprise客户的测试阶段。该...
Learn The Most In-Demand Tech Skills for FREE
From April 30 - May 10, Zero To Mastery's entire course catalogue is 100% free.
埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
Meta正在为其AI工具投放快速致富广告
Meta收购的AI公司Manus正在推广其工具，声称可以帮助用户轻松赚取收入。该公司通过支付内容创作者在社交媒体上宣传其产品，鼓励用户利用AI为本地企业建...