本研究提出了一种新方法,将杂乱的对抗性提示转化为连贯文本,解决现有越狱攻击方法的局限性。此方法揭示并转移模型脆弱性,提高了攻击成功率,为设计越狱攻击提供新思路。
完成下面两步后,将自动完成登录并继续当前操作。