思科研究发现,企业在评估AI模型时使用的安全基准存在问题。多轮对话攻击的成功率显著高于单轮对话,且单轮表现无法有效预测多轮韧性。不同模型在多轮攻击下的表现差异明显,某些模型在配置变化下的安全性变化未被现有基准捕捉。思科建议AI提供商应披露部署设置对安全性的影响。
完成下面两步后,将自动完成登录并继续当前操作。