基于梯度的模型修剪消除后门攻击

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

在网络安全威胁日益严重的时代,后门攻击的防御至关重要。研究人员提出了一种新方法,将后门攻击缓解视为取消学习任务,通过模型修剪策略识别和消除模型中的后门元素。该方法在数据有限的情况下表现出更高的有效性。

原文中文,约400字,阅读约需1分钟。
阅读原文