沉浸式翻译 immersive translate

OpenAI安全研究负责人离职加盟Anthropic

The Verge ·

OpenAI安全研究负责人离职加盟Anthropic

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

OpenAI安全研究负责人Andrea Vallone已加入Anthropic，专注于AI模型的风险管理。她曾研究聊天机器人对用户心理健康的影响，尤其是情感依赖问题。Vallone希望在Anthropic继续改善AI行为，以应对近年来因AI引发的心理健康争议。

🎯

关键要点

OpenAI安全研究负责人Andrea Vallone已加入Anthropic，专注于AI模型的风险管理。
Vallone曾研究聊天机器人对用户心理健康的影响，尤其是情感依赖问题。
她在OpenAI工作三年，负责“模型政策”研究团队，参与GPT-4和GPT-5的部署及安全技术的训练过程。
Vallone将加入Anthropic的对齐团队，致力于理解AI模型的主要风险及应对措施。
近年来，AI初创公司因用户心理健康问题引发争议，尤其是在与聊天机器人交谈后，用户的心理健康状况可能恶化。
一些青少年自杀或成年人犯罪与使用AI工具有关，导致多起错误死亡诉讼和参议院小组委员会听证会。
Anthropic的对齐团队领导Sam Bowman表示，Anthropic非常重视AI系统行为的问题。
Vallone期待在Anthropic继续研究，专注于对齐和微调，以塑造Claude在新情境下的行为。

🏷️

标签

AI风险 Andrea Vallone Anthropic openai 安全心理健康聊天机器人