神经执行:针对提示注入攻击的学习(和对学习的利用)执行触发器

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们引入了一种新型的注入攻击家族,被称为神经执行。与手工制作字符串的已知攻击不同,我们使用基于学习的方法自动生成可触发执行的可能性。攻击者可以设计和生成持久存在的神经执行,规避现有的检测和净化方法。

🎯

关键要点

  • 引入了一种新型的注入攻击家族,称为神经执行。
  • 神经执行与依赖手工制作字符串的已知攻击不同。
  • 展示了将执行触发器的创建概念化为可微分的搜索问题。
  • 使用基于学习的方法自动生成触发器的可能性。
  • 攻击者可以伪造出比当前手工制作的触发器效果显著更好。
  • 神经执行在形状、属性和功能上具有固有的灵活性。
  • 攻击者可以设计和生成持久存在的神经执行,规避现有的检测和净化方法。
  • 攻击者可以产生与任何已知攻击明显不同的触发器形式。
➡️

继续阅读