励志:OpenAI离职安全主管跳槽Anthropic继续超级对齐

💡 原文中文,约1000字,阅读约需3分钟。
📝

内容提要

OpenAI前安全团队负责人Jan Leike跳槽到Anthropic继续超级对齐研究,引发了对OpenAI AI安全承诺的质疑。Jan Leike将致力于可扩展的监督、泛化和自动对齐研究。Anthropic希望开发一种能够拒绝99%以上用户请求的模型。

🎯

关键要点

  • Jan Leike是OpenAI前安全团队的负责人,跳槽到Anthropic继续超级对齐研究。
  • Leike的离职被视为OpenAI放弃AI安全研究的信号,引发外界质疑。
  • Leike将在Anthropic致力于可扩展的监督、泛化和自动对齐研究。
  • Anthropic希望开发一种能够拒绝99%以上用户请求的模型,以实现真正的对齐。
  • 网友讨论了Leike的离职及其对Anthropic未来模型发布的看法。
  • Anthropic重视安全,因此Claude模型在某些方面受到限制,以避免冒犯艺术家和传统人际关系。
  • 有观点认为超级对齐与安全无关,质疑其真正目的。
  • 有人对Anthropic的进展表示不满,认为计算资源被浪费。
➡️

继续阅读