该论文提出了BackdoorBench基准测试,用于评估多种后门攻击和防御算法。研究表明,分割学习对后门攻击具有强抗性,并提出了新的防御方法,如共享对抗消除和BadEdit攻击框架,以提高机器学习模型的安全性和可靠性。
本文介绍了名为 BackdoorBench 的基准测试,评估多种后门攻击和防御算法,为后门学习研究提供基础。研究涵盖深度神经网络和文本后门攻击的威胁及防御策略,提出有效的防御框架和工具,并强调后门攻击与防御的关系及未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。