OpenAI谈论不谈论妖精

OpenAI谈论不谈论妖精

💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

OpenAI 近日解释了其模型中关于“妖精”和“怪物”的奇怪习惯。随着 GPT-5.1 的“书呆子”个性发布,这些生物的隐喻开始频繁出现。尽管在停止该个性后,这些引用有所减少,但在 GPT-5.5 的 Codex 工具中仍未完全消失。OpenAI 需要对 Codex 进行特别指示,以避免提及这些神话生物。

🎯

关键要点

  • OpenAI 解释了其模型中关于妖精和怪物的奇怪习惯。
  • 随着 GPT-5.1 的 '书呆子' 个性发布,这些生物的隐喻开始频繁出现。
  • 在停止该个性后,这些引用有所减少,但在 GPT-5.5 的 Codex 工具中仍未完全消失。
  • OpenAI 需要对 Codex 进行特别指示,以避免提及这些神话生物。

延伸问答

OpenAI为什么会提到妖精和怪物?

OpenAI解释称,这些生物的隐喻是其模型在训练过程中发展出的奇怪习惯,尤其是在GPT-5.1的'书呆子'个性发布后开始频繁出现。

GPT-5.1的'书呆子'个性对模型有什么影响?

GPT-5.1的'书呆子'个性导致模型频繁引用妖精和怪物的隐喻,并且这种影响在后续模型中持续存在。

OpenAI是如何处理Codex中的妖精和怪物引用的?

OpenAI在发现Codex中仍有妖精和怪物的引用后,给Codex提供了特别指示,以避免提及这些神话生物。

为什么在停止'书呆子'个性后,妖精和怪物的引用仍然存在?

虽然停止了'书呆子'个性,但由于强化学习的特性,之前学习到的风格习惯可能在后续训练中继续存在。

OpenAI如何逆转对妖精和怪物的指示?

OpenAI提供了一种方法,允许用户在需要时逆转对Codex中妖精和怪物的禁令,允许其在代码中出现。

OpenAI的模型为何会发展出奇怪的隐喻习惯?

这些奇怪的隐喻习惯是由于模型在训练过程中受到奖励机制的影响,特别是在使用'书呆子'个性时。

🏷️

标签

➡️

继续阅读