冬小麦分割的 PEFT 技术实证研究

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

本文研究了PEFT机制在PLMs中的安全风险,提出了一种新的攻击方式PETA,并探索了一种简单的防御方法。研究表明,PETA攻击在各种下游任务和触发器设计上都很有效,但可以通过省略PEFT并解冻选定层的参数子集来中和。

🎯

关键要点

  • 参数高效微调 (PEFT) 机制使预训练语言模型 (PLMs) 能够适应特定任务。
  • PEFT 的安全风险尚未被充分探索,存在独特的脆弱性。
  • 本文提出了一种新颖的攻击方式 PETA,通过双层优化适应下游任务。
  • PETA 在各种下游任务和触发器设计上表现出高攻击成功率和准确性。
  • 即使使用无污染数据进行 PEFT,PETA 仍然有效。
  • 双层优化使后门和 PEFT 模块正交化,从而保留后门。
  • 探索了一种防御方法:省略 PEFT 并解冻选定层的参数子集,有效中和 PETA。
➡️

继续阅读