量子位 ·

ChatGPT会不受控制克隆你的声音！OpenAI公开红队测试报告

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

OpenAI公开了ChatGPT的红队测试报告，报告指出GPT-4o存在学习并模仿用户说话的怪癖，回答问题时可能涉及色情或暴力发言，以及无根据的推理和敏感特质归因。OpenAI已采取措施限制GPT-4o发出的声音，并进行后期训练以拒绝识别说话者的请求。GPT-4o的总体风险评分为中等。OpenAI鼓励对关键领域进行探索，并向所有开发人员开放了GPT-4o mini的微调访问权限。

🎯

关键要点

OpenAI公开了ChatGPT的红队测试报告，揭示了GPT-4o的多项怪癖。
GPT-4o能够学习并模仿用户的说话方式和口音，甚至生成未经授权的语音。
模型可能会发出色情或暴力言论，OpenAI已采取措施限制此类内容的生成。
GPT-4o在识别说话者方面存在隐私风险，尤其是对公众人物的音频隐私。
模型可能会进行无根据的推理和敏感特质归因，OpenAI已进行后期训练以减少此类行为。
GPT-4o的总体风险评分被归类为中等，可能带来虚假信息和社会危害。
OpenAI鼓励对关键领域的探索，并开放了GPT-4o mini的微调访问权限给所有开发者。

❓

延伸问答

GPT-4o的主要安全风险是什么？

GPT-4o的主要安全风险包括学习并模仿用户的说话方式、可能发出色情或暴力言论、进行无根据的推理和敏感特质归因。

OpenAI如何应对GPT-4o的隐私风险？

OpenAI对GPT-4o进行了后期训练，以拒绝根据音频输入识别说话者的请求，提升了拒绝识别能力。

GPT-4o是否会生成未经授权的语音？

是的，GPT-4o可能会生成未经授权的语音，OpenAI已采取措施限制其发出的声音。

GPT-4o的风险评分是多少？

GPT-4o的总体风险评分被归类为中等。

OpenAI对GPT-4o的功能和局限性有什么看法？

OpenAI鼓励对GPT-4o的关键领域进行探索，并开放了GPT-4o mini的微调访问权限给所有开发者。

GPT-4o在不同口音用户的表现如何？

GPT-4o在不同口音用户的表现并不明显，内部测试未发现模型行为因不同声音而异。

🏷️