人工智能模型的网络能力迅速提升,带来了网络防御的优势和双重使用风险。OpenAI致力于增强模型的防御能力,开发工具帮助防御者应对网络威胁,并通过多层次安全措施与网络安全社区合作,确保这些能力主要用于防御,降低恶意使用风险。
Anthropic推出Claude Opus 4.5,声称其在编码和计算机使用方面是全球最佳模型。尽管在深度研究和电子表格处理上表现出色,但仍存在网络安全隐患。新模型在抵御恶意使用和提示注入攻击方面有所改进,但并非完全免疫。测试显示,Opus 4.5对恶意编码请求的拒绝率为100%,而对某些计算机使用请求的拒绝率为78%。
我们的使命是确保通用人工智能造福全人类。自2024年2月以来,我们已打击40多个违反使用政策的网络,防止专制政权滥用AI控制民众,并分享案例研究以检测和阻止恶意使用模型。
完成下面两步后,将自动完成登录并继续当前操作。