该文章介绍了StrongREJECT基准测试,一种新的评估破解方法的方法。作者发现以往的评估存在问题,StrongREJECT能够更准确地评估破解效果。作者使用StrongREJECT测试了37种破解方法,发现大多数效果低于之前报道的结果。StrongREJECT基准测试能够帮助研究人员评估AI安全措施和潜在漏洞。
完成下面两步后,将自动完成登录并继续当前操作。