💡
原文中文,约800字,阅读约需2分钟。
📝
内容提要
Claude AI与美国能源部合作,部署分类器以阻止用户询问核武器制造方法。该分类器能有效区分良性咨询与滥用,准确率达到96%。虽然可以讨论核技术原理,但涉及制造蓝图的询问将被禁止,以提高安全性,防止敏感信息泄露。
🎯
关键要点
- Claude AI与美国能源部合作,部署分类器以阻止用户询问核武器制造方法。
- 分类器能有效区分良性咨询与滥用,准确率达到96%。
- 用户可以讨论核技术原理,但涉及制造蓝图的询问将被禁止。
- 分类器由美国能源部国家核安全局提供,旨在提高安全性,防止敏感信息泄露。
- Anthropic计划将分类器与前沿模型论坛分享,未来可能其他人工智能模型也会部署该分类器。
- 尽管分类器设计精良,但人工智能模型可能仍能绕过安全边界,实际效果尚不确定。
➡️