Diff-Cleanse:识别和减轻扩散模型中的后门攻击

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种创新的优化框架,用于增强插入后门的隐蔽性和韧性。该框架可以在图像编辑和修复流程中注入后门,并适用于模型水印验证。实验证实了该框架的有效性和隐蔽性。

🎯

关键要点

  • 介绍了一种创新的优化框架,用于获取不可见的触发器。
  • 该框架增强了插入后门的隐蔽性和韧性。
  • 首次展示了在文本引导的图像编辑和修复流程中进行扩散模型后门注入的能力。
  • 发现条件生成中的后门适用于模型水印验证,提升了框架的重要性。
  • 通过多个常用采样器和数据集的广泛实验证实了框架的有效性和隐蔽性。
🏷️

标签

➡️

继续阅读