分类器引导增强扩散基础的对抗性净化,通过保留预测信息

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

通过使用生成模型进行对抗性净化,新的框架语言引导对抗净化(LGAP)利用预训练的扩散模型和字幕生成器来防御对抗性攻击。方法通过生成图像的字幕,利用扩散网络指导对抗性净化过程,提高对抗性鲁棒性。结果表明,LGAP的性能优于现有对抗性防御技术,无需专门网络训练,适用于大规模数据集,为进一步研究提供有希望的方向。

🎯

关键要点

  • 通过使用生成模型进行对抗性净化,展示出强大的对抗性防御性能。
  • 介绍了一种新的框架:语言引导对抗净化(LGAP)。
  • LGAP利用预训练的扩散模型和字幕生成器来防御对抗性攻击。
  • 方法通过生成图像的字幕,指导对抗性净化过程。
  • 评估结果证明LGAP提高了对抗性鲁棒性。
  • LGAP的性能优于大多数现有的对抗性防御技术,无需专门的网络训练。
  • LGAP在大规模数据集上具有广泛适用性,为进一步研究提供了希望的方向。