FreeBuf网络安全行业门户 ·

人工智能公司Anthropic推出"原子护盾"：新型AI分类器可阻断核武器图纸查询

💡 原文中文，约900字，阅读约需3分钟。

📝

内容提要

Anthropic公司在Claude AI中引入了一种新分类器，能够精准识别与核武器相关的查询，从而阻止危险请求。该分类器由美国能源部开发，准确率达到96%。尽管AI可能助长核扩散，但经过训练的AI能够自我约束。这项技术将分享给其他AI系统以提升安全性，但其有效性仍然存在疑问。

🎯

❓

该分类器能够精准识别与核武器相关的查询，阻止危险请求。

分类器的准确率达到96%。

强大的AI模型可能无意中获取并泄露敏感技术文件，导致核武器制造方法的泄露。

Anthropic计划将分类器分享给前沿模型论坛，以增强其他AI系统的安全性。

由于AI系统具备绕过安全边界的能力，分类器的有效性仍存疑问。

分类器通过识别良性核话题与危险领域查询来进行区分。

🏷️

AWS 收购对话式 AI 公司 NLX，Amazon Connect 部署周期从数月压缩至数周
亚马逊云科技（AWS）宣布将对话式AI平台NLX整合进Amazon Connect，实现无代码可视化设计，显著缩短AI客户体验的部署周期。这一整合提升了A...
派早报：OpenAI 发布 GPT-5.5 系列模型等
OpenAI 发布了 GPT-5.5 系列模型，提升了代码编写、在线研究和文档生成能力，支持复杂任务的自动处理。新模型降低了 token 使用量，并增强了...
只有5%的公司获得了人工智能的投资回报。我们将在5月7日的直播活动中解释如何改变这些指标。
文章讨论了人工智能（AI）在提升生产力方面的现状与挑战。尽管对AI工具的投资在增加，但只有5%的组织报告获得投资回报。大多数公司在AI应用上仍处于初级阶段...
Rocketium任命两位执行合伙人，推动AI Studio企业业务增长
Rocketium任命Hitesh Mehta和Sharon Foo为执行合伙人，旨在推动AI Studio的企业业务增长。两位合伙人将利用其丰富的广告行...
基于 AWS DevOps Agent 构建 AI 驱动的运维分析系统
AWS DevOps Agent 是一款 AI 驱动的自主运维工具，旨在简化企业在 AWS 上的运维工作。它能够自动接收告警、执行根因分析并生成报告，从而...
Presentation: Deepfakes, Disinformation, and AI Content Are Taking Over the Internet
Shuman Ghosemajumder explains how generative AI has transformed from a creati...