以火攻火:使用模式随机化的防御贴片对抗拼贴攻击

原文约400字,阅读约需1分钟。发表于:

本文提出了一种新颖且通用的对抗攻击防御方法,采用了 “以火攻火” 的原则,并通过注入两种类型的防御贴片,Canary 和 Woodpecker,实施主动防御策略,以主动检测和削弱潜在的对抗贴片,而无需修改目标模型。同时,采用软件安全中的随机化技术,使用随机注入方式来抵御能够识别防御的攻击。通过全面的实验证明了所提出的方法的有效性和实用性,结果表明 Canary 和 Woodpecker 在面对未知攻击方法时也能取得很高的性能,且对时间开销的影响有限。此外,通过适应性攻击实验,也显示出本方法对于防御识别攻击具有足够的鲁棒性。

本文提出一种新型通用对抗攻击防御方法,利用“以火攻火”原则,通过Canary和Woodpecker两种防御贴片实施主动防御。该方法不需改动目标模型,结合随机化技术提高安全性。实验证明该方法有效、实用,对时间影响小,且能抵御适应性攻击。

相关推荐 去reddit讨论