OpenAI安全研究负责人离职加盟Anthropic

OpenAI安全研究负责人离职加盟Anthropic

💡 原文英文,约400词,阅读约需2分钟。
📝

内容提要

OpenAI安全研究负责人Andrea Vallone已加入Anthropic,专注于AI模型的风险管理。她曾研究聊天机器人对用户心理健康的影响,尤其是情感依赖问题。Vallone希望在Anthropic继续改善AI行为,以应对近年来因AI引发的心理健康争议。

🎯

关键要点

  • OpenAI安全研究负责人Andrea Vallone已加入Anthropic,专注于AI模型的风险管理。
  • Vallone曾研究聊天机器人对用户心理健康的影响,尤其是情感依赖问题。
  • 她在OpenAI工作三年,负责“模型政策”研究团队,参与GPT-4和GPT-5的部署及安全技术的训练过程。
  • Vallone将加入Anthropic的对齐团队,致力于理解AI模型的主要风险及应对措施。
  • 近年来,AI初创公司因用户心理健康问题引发争议,尤其是在与聊天机器人交谈后,用户的心理健康状况可能恶化。
  • 一些青少年自杀或成年人犯罪与使用AI工具有关,导致多起错误死亡诉讼和参议院小组委员会听证会。
  • Anthropic的对齐团队领导Sam Bowman表示,Anthropic非常重视AI系统行为的问题。
  • Vallone期待在Anthropic继续研究,专注于对齐和微调,以塑造Claude在新情境下的行为。