极道 ·

励志：OpenAI离职安全主管跳槽Anthropic继续超级对齐

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

OpenAI前安全团队负责人Jan Leike跳槽到Anthropic继续超级对齐研究，引发了对OpenAI AI安全承诺的质疑。Jan Leike将致力于可扩展的监督、泛化和自动对齐研究。Anthropic希望开发一种能够拒绝99%以上用户请求的模型。

🎯

❓

Jan Leike跳槽到Anthropic是为了继续进行超级对齐研究，专注于可扩展的监督和自动对齐。

Leike的离职被视为OpenAI放弃AI安全研究的信号，引发了外界对其安全承诺的质疑。

Anthropic希望开发一种能够拒绝99%以上用户请求的模型，以实现真正的对齐。

网友对Leike的跳槽表示讨论，有人认为这是他应该去的地方，也有人对Anthropic未来的模型发布表示担忧。

Anthropic重视安全，因此Claude模型在某些方面受到限制，以避免冒犯艺术家和传统人际关系。

有观点认为超级对齐与安全无关，质疑其真正目的，并有人对Anthropic的进展表示不满，认为计算资源被浪费。

🏷️