内容提要
英国人工智能安全研究所(ASI)评估了Anthropic的新模型Claude Mythos Preview,发现其在网络安全能力上有显著提升,尤其在捕获旗帜(CTF)和多步骤网络攻击模拟中表现出色,能够自主执行攻击。然而,ASI警告称该模型在现实环境中的表现可能会有所不同,特别是在面对防御良好的系统时。
关键要点
-
英国人工智能安全研究所(ASI)评估了Anthropic的新模型Claude Mythos Preview,发现其在网络安全能力上有显著提升。
-
Claude Mythos Preview在捕获旗帜(CTF)和多步骤网络攻击模拟中表现出色,能够自主执行攻击。
-
ASI警告称,该模型在现实环境中的表现可能会有所不同,特别是在面对防御良好的系统时。
-
Claude Mythos Preview在模拟中成功完成了32步网络攻击的任务,表现优于之前的模型Claude Opus 4.6。
-
尽管Claude Mythos Preview在评估中表现优异,但其在现实世界中的攻击能力仍存在不确定性,尤其是针对防御良好的系统。
延伸问答
Claude Mythos Preview在网络安全能力上有哪些显著提升?
Claude Mythos Preview在捕获旗帜(CTF)和多步骤网络攻击模拟中表现出色,能够自主执行攻击。
ASI对Claude Mythos Preview的评估结果是什么?
ASI评估显示Claude Mythos Preview在多步骤攻击模拟中成功完成了32步任务,表现优于之前的模型Claude Opus 4.6。
Claude Mythos Preview在现实环境中的表现如何?
ASI警告称,Claude Mythos Preview在现实环境中的表现可能会有所不同,特别是在面对防御良好的系统时。
Claude Mythos Preview的攻击能力存在哪些不确定性?
模型在攻击能力上存在不确定性,尤其是针对防御良好的系统,可能无法有效攻击。
哪些组织获得了Claude Mythos Preview的特别访问权限?
获得特别访问权限的组织包括亚马逊、苹果、微软等大公司,以及约40个其他组织。
Claude Mythos Preview在CTF挑战中的表现如何?
在CTF挑战中,Claude Mythos Preview在专家级任务中成功率达到73%。