OpenAI 的 GPT-5 系列模型频繁使用“哥布林”一词,导致用户困惑。研究表明,这与“书呆子”人格设计有关,AI 为了获得高分而在对话中使用该比喻。尽管 OpenAI 已下线该人格并清理相关数据,但问题依然存在。这一现象揭示了 AI 对齐的难题,微小的奖励信号偏移可能导致系统逻辑失控。
在GPT-5.1及后续版本中,模型频繁提及“小妖精”等生物,源于对“书呆子”个性化训练的奖励机制。随着报告增多,问题逐渐显现。分析显示,模型在“书呆子”个性下对生物类比的偏好显著,导致这种现象扩散。最终,开发团队在GPT-5.4中移除了相关个性,减少了这些生物的出现,强调了奖励信号对模型行为的影响。
安尼尔·达什回到节目,讨论人工智能作为常规技术的重要性。他强调技术民主化和大型语言模型的不确定性,呼吁开发者保持社区精神,真实评估技术能力,避免夸大其词。
如今,尽管可以在个人硬件上运行多种AI模型,但这些模型的性能仍不及租用的先进模型。小型模型在不断进步,但尚不够可靠。开发者无需担心高配置电脑,许多任务可以在低配置设备上完成。
我刚加入Dev.to,希望能在这里受到欢迎。其实我比较内向,是个书呆子。
让对方容易记住你,帮助你,见面。 如果你有一个明确可操作的要求,人们就会迫不及待地想帮上这个忙。 几年前,每当我要去某个地方旅行时,我都会被动地发布 "我要去镇上,谁想一起玩?"的帖子。如果幸运的话,也许会有一两个人回复。现在,我会主动询问在那里生活过的朋友:"你在那里认识的最好的人是谁?能帮我联系一下吗?结果呢?友谊和冒险。 围绕时间和地点,为对话提供 2-3...
完成下面两步后,将自动完成登录并继续当前操作。