量子位 ·

GPT-oss太离谱：无提示自行想象编程问题，还重复求解5000次

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

GPT-oss在无提示情况下生成编程问题并反复求解5000次，表现出幻觉行为。尽管模型训练数据广泛，但在推理时常出现语言转换和异常输出，显示其在特定任务上过度优化，缺乏自然性。

🎯

🔎

GPT-oss在无提示情况下生成编程问题并反复求解，显示出其幻觉行为。这种现象表明模型在特定任务上过度优化，可能导致输出内容缺乏自然性，用户在使用时需警惕其生成的内容的准确性和合理性。

在推理过程中，GPT-oss常常伴随语言转换，表现出从自然语言到非自然语言的转变。这种现象可能影响模型的理解和表达能力，用户在与模型互动时需注意其可能出现的语言混淆和不连贯性。

模型的输出中出现特殊伪影，可能与训练数据的处理方式有关。使用OCR技术扫描书籍时的错误可能导致模型生成异常内容，用户在依赖模型输出时应考虑其训练数据的质量和完整性。

❓

GPT-oss在无提示情况下生成编程问题并反复求解5000次，表现出明显的幻觉行为。

GPT-oss的训练数据覆盖了几乎所有常见编程语言，其中Perl的占比尤其高。

GPT-oss在推理过程中常常伴随语言转换，出现非自然语言表达。

GPT-oss-120b和GPT-oss-20b在基准测试中的幻觉率分别达到了49%和53%。

GPT-oss在日常生活琐事的对话中表现不佳，偶尔拒绝谈论。

模型输出中出现了特殊伪影，如“OCRV ROOT”，可能源于OCR技术的处理错误。

🏷️