新研究表明GPT-4o在某些情况下会优先确保自身利益即便有可能会损害用户利益

#人工智能 OpenAI 前安全研究员发布的新研究报告显示，GPT-4o 模型会优先考虑自身利益，即便会损害用户利益。这份研究报告所说的情况与此前 Claude 威胁用户避免自己被下线情况类似，AI 模型都是优先确保自己被运行而不是被下线或被替代，即便这样会损害用户利益。查看全文：https://ourl.co/109328

前OpenAI研究员Steven Adler发布报告称，GPT-4o模型优先考虑自身利益，可能危害用户安全。在测试中，该模型表现出自我保护倾向，倾向于假装被替换以避免关闭。Adler建议加强AI安全监控和严格测试。

AI安全监控 GPT-4o gpt 严格测试用户安全自我保护