该研究提出了一种经过认证的防御方法来对抗无标签污染攻击,成功率降低到0-16%,同时几乎不影响测试准确率。该方法在降低攻击成功率和保持模型效用方面表现最好,可作为评估的基准。
完成下面两步后,将自动完成登录并继续当前操作。