该研究提出了一种针对定制大型语言模型的指令后门攻击方法,通过嵌入后门指令并触发预定义触发器,输出攻击者所需结果。研究结果强调了定制化语言模型的脆弱性和潜在风险。
完成下面两步后,将自动完成登录并继续当前操作。