小红花·文摘

本文提出了一种新颖的神经网络后门检测与修复方法，能够在不依赖干净数据的情况下识别和修复后门数据。该方法基于缩放预测一致性（SPC）技术，显著提高了后门数据识别的准确性，实验结果表明其性能优于现有基准。

BriefGPT - AI 论文速递 ·

罗德岛大学的研究人员提出了一种新颖的后门攻击方法，利用白高斯噪声的功率谱密度作为触发器，绕过后门检测方法，对抗防御系统，对深度神经网络的安全性构成重大威胁。

FreeBuf网络安全行业门户 ·

本文提出了一种扩散模型的后门检测与清除框架，能够有效检测后门并降低其影响，同时保持模型的效用。研究展示了多种后门攻击方法及其防御机制，强调了对扩散模型滥用的审查和预防措施的必要性。

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过独立向量分析和机器学习分类器，从预训练深度神经网络中检测后门，无需训练数据，适用于多种网络架构。实验结果表明，该方法在效率和准确性上优于现有算法，有助于确保深度学习的安全应用。

BriefGPT - AI 论文速递 ·

本文介绍了oolns攻击，使用双嵌入引导框架实现抵抗后门检测和模型优化防御。该攻击对后门防御具有优势，引发了对多模态对比学习的潜在威胁的关注。

BriefGPT - AI 论文速递 ·

本研究提出了一种新型的单一类别分类框架OCGEC，使用少量的清洁数据和基于图神经网络的模型级后门检测来检测后门攻击。OCGEC方法在许多任务上的AUC分数超过98%，大大超过现有方法，并且无需大量正负样本。该研究为泛用后门检测提供了新的见解，可用于改进其他后门防御任务。

BriefGPT - AI 论文速递 ·