OpenAI 最新模型将封堵“忽略所有先前指令”漏洞
原文英文,约700词,阅读约需3分钟。发表于: 。Illustration by Cath Virginia / The Verge | Photos by Getty Images Have you seen the memes online where someone tells a bot to “ignore all previous instructions” and proceeds to break it in the...
OpenAI研究人员开发了一种名为“指令层次结构”的技术,以防止AI机器人的滥用和未经授权的指令。该技术将开发者的原始提示置于用户提示之上,使模型更安全。OpenAI的GPT-4o Mini是第一个实施该技术的模型。公司旨在为用户的数字生活构建完全自动化的代理程序,而这种安全机制是必要的一步。该技术赋予系统指令更高的特权,并识别不对齐的提示以做出适当的响应。OpenAI一直在解决安全问题,并致力于改进安全和透明度的做法。