BriefGPT - AI 论文速递 ·

基于动态数据增强操作的长尾后门攻击

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文提出了一种新颖的神经网络后门检测与修复方法，能够在不依赖干净数据的情况下识别和修复后门数据。该方法基于缩放预测一致性（SPC）技术，显著提高了后门数据识别的准确性，实验结果表明其性能优于现有基准。

🎯

❓

基于缩放预测一致性（SPC）的后门检测方法是一种新颖的技术，能够在不依赖干净数据的情况下识别和修复后门数据，显著提高识别准确性。

实验结果表明，该方法在识别后门数据点方面的性能优于现有基准，平均AUROC提高了约4%-36%。

后门攻击通过植入恶意样本来欺骗机器学习模型，使其在测试时产生错误的预测，威胁系统的安全性和可靠性。

该方法将后门数据的识别问题转化为一个分层数据分割优化问题，并利用新的基于SPC的损失函数作为优化目标。

该方法设计为在被污染的数据集中自动识别后门数据，因此不需要额外的干净数据或手动定义检测阈值。

该研究提供了一种新的后门检测和修复方法，可能为未来的深度学习后门研究提供参考工具，尤其是在处理被污染数据时。

🏷️