FreeBuf网络安全行业门户 ·

AI大模型新型噪声攻击曝光，可绕过最先进的后门检测

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

罗德岛大学的研究人员提出了一种新颖的后门攻击方法，利用白高斯噪声的功率谱密度作为触发器，绕过后门检测方法，对抗防御系统，对深度神经网络的安全性构成重大威胁。

🎯

关键要点

罗德岛大学的研究人员提出了一种新颖的后门攻击方法，利用白高斯噪声的功率谱密度作为触发器。
该攻击提高了攻击的可行性和普遍性，在各种数据集和模型中取得了高的平均攻击成功率。
NoiseAttack是一种用于图像分类的后门攻击，能够绕过最先进的后门检测方法。
该攻击使用具有不同功率谱密度的白高斯噪声作为触发器，灵活控制目标标签。
攻击性能在不同数据集和模型上表现良好，能够有效对抗最先进的防御系统。
通过引入白高斯噪声，该攻击可以将图像错误分类为目标标签，而不显著影响模型在干净数据上的性能。
该攻击对多种防御机制表现出强鲁棒性，可能对深度神经网络的安全性构成重大威胁。
执行多目标攻击的能力证明了该攻击的多功能性和适应性。

❓

延伸问答

NoiseAttack是什么？

NoiseAttack是一种新型的后门攻击方法，利用白高斯噪声的功率谱密度作为触发器，主要用于图像分类。

这种攻击如何绕过后门检测？

该攻击通过使用白高斯噪声作为触发器，能够有效规避最先进的后门检测方法。

NoiseAttack的攻击成功率如何？

NoiseAttack在各种数据集和模型中实现了较高的平均攻击成功率。

这种攻击对深度神经网络的安全性有什么影响？

NoiseAttack对深度神经网络的安全性构成重大威胁，因其能有效对抗多种防御机制。

NoiseAttack能否执行多目标攻击？

是的，NoiseAttack能够灵活控制目标标签，执行多目标攻击。

这种攻击对模型的干净数据性能有影响吗？

引入白高斯噪声后，该攻击不会显著影响模型在干净数据上的性能。

🏷️

标签

ai 功率谱密度后门攻击后门检测大模型深度神经网络白高斯噪声

➡️

继续阅读

从 ICML 2026 论文精选看 AI 工程化的下一步
ICML 2026 论文精选探讨了机器学习的关键挑战与实际影响，强调工程团队需关注研究与工程问题的转化。会议论文揭示未来技术栈的潜在问题，企业团队通过精选...
AI in Harness（一）
本文探讨了基于 Java 的开源 Loop-based Agent Harness 框架，旨在提升 AI 的执行效率。通过 Loop Engineerin...
Coinbase运行1200个代理，并将其AI费用削减了一半
Vercel和Coinbase的CEO正在构建多模型生产系统，以避免依赖单一AI提供商。两家公司通过降低成本、任务路由和缓存优化，提高了AI模型的使用效率...
Meta的新Muse Image模型可以将其他Instagram用户融入AI生成的照片中
Meta推出了Muse Image模型，用户可以在Instagram中@提及其他账户，AI将其形象融入生成的图像中。该模型支持图像转换、设计邀请函和明信片...
观看AWS工程师使用OpenTelemetry和OpenSearch排除代理AI故障
文章讨论了如何通过OpenTelemetry框架和OpenSearch引擎提升系统性能监控和数据分析。随着AI代理的普及，传统的日志和指标模型已无法应对日...
Vercel收购Better Auth，为AI代理提供独立身份
Vercel收购了开源身份验证框架Better Auth，以解决AI代理的身份问题。Better Auth创始人Bereket Engida及其团队将加入...