BriefGPT - AI 论文速递 ·

噪声攻击：一种通过白噪声实现的样本特定多目标隐秘后门攻击

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

本研究提出了多种深度学习后门攻击方法，包括隐形后门和基于频域的WaveAttack，能够有效绕过现有防御措施。同时，开发了噪声检测器NoiSec，通过噪声识别恶意数据篡改，展现出优越的检测能力。

🎯

关键要点

本研究提出了一种新颖的深度学习后门攻击方式，攻击者在训练过程中提供正常标注的毒瘤数据，并隐藏触发器，待测试时激活攻击。
提出了一种基于扭曲触发器的后门攻击和新型训练模式“噪声模式”，使攻击机制难以被检测。
研究采用频率分析视角，发现现有后门攻击在高频领域存在问题，并提出平滑后门攻击方法。
提出了一种名为WaveAttack的基于频域的后门攻击方法，通过离散小波变换获取图像高频特征，增强触发器的有效性和隐匿性。
提出了一种只需对干净模型进行最小修改的后门攻击范例，评估其在多个数据集上的有效性。
改进了针对后门特征的逆向，实验结果表明BAN防御在多个数据集上效率显著提高。
提出了噪声检测器NoiSec，通过噪声识别恶意数据篡改，展现出优越的检测能力。

❓

延伸问答

什么是噪声攻击？

噪声攻击是一种深度学习后门攻击方式，攻击者在训练过程中提供正常标注的毒瘤数据，并隐藏触发器，待测试时激活攻击。

WaveAttack方法的主要特点是什么？

WaveAttack是一种基于频域的后门攻击方法，通过离散小波变换获取图像高频特征，增强触发器的有效性和隐匿性。

如何检测恶意数据篡改？

可以使用噪声检测器NoiSec，通过噪声识别恶意数据篡改，展现出优越的检测能力。

研究中提出的后门攻击有哪些新颖之处？

研究提出了基于扭曲触发器的后门攻击和新型训练模式“噪声模式”，使攻击机制难以被检测。

现有后门攻击在高频领域存在哪些问题？

现有后门攻击在高频领域存在严重问题，研究提出了平滑后门攻击方法以去除这些问题。

BAN防御的效果如何？

实验结果表明，BAN防御在多个数据集上效率显著提高，特别是在CIFAR-10和ImageNet200上有显著提升。

🏷️

标签

后门攻击噪声检测数据篡改深度学习防御措施

➡️

继续阅读

月之暗面发布Kimi K3加剧美国芯片股抛售；小米或上调手机出货目标；三星电子将成立机器人部门加速研发及商业化
(全球TMT 2026年07月21日讯)今日要点：月之暗面发布Kimi K3加剧美国芯片股抛售；小米或上调手机 […]
基于超1万肿瘤样本训练，哈佛医学院等提出泛癌症基础模型COMPASS，平均性能优于22种现有方法
COMPASS 首次将这一架构引入癌症转录组分析领域，通过利用免疫相关基因集，并建立：基因（gene）→ 基因集（gene set）→ 概念（concep...
在AI帮助下黑客在漏洞公布数小时后就针对WordPress发起远程代码执行攻击
#安全资讯在漏洞公布数小时后，黑客就利用 AI 成功发掘 WordPress 高危安全漏洞并发起攻击，部分网站可能会被黑客添加管理员账号或在服务器上部署...
XZ 后门这件事，最该记住的不是 0.5 秒
XZ Utils 后门再次提醒我们，供应链安全不只是一套扫描工具能解决的问题。真正容易被忽略的，是维护者压力、构建链路、发布包和线上异常之间那些不起眼的缝。
四通集团STONETEK携G5208系列三款旗舰产品出征WAIC 2026
(全球TMT 2026年07月21日讯)2026年7月17日至20日，世界人工智能大会暨人工智能全球治理高级别 […]
In a world of AI agents, where do we fit in?
For more than a decade, leaders have used the phrase “Future of Work” to desc...