提示词注入攻击已成为大模型的主要威胁。研究表明,TokenBreak可以绕过文本分类模型的检测,通过巧妙修改输入词汇而不改变其含义。BERT等模型易受攻击,而Unigram模型相对安全,因此建议在提示词检测中优先使用Unigram模型。
完成下面两步后,将自动完成登录并继续当前操作。