BriefGPT - AI 论文速递 ·

欺骗的艺术：使用动态叠加触发器的强健后门攻击

💡 原文中文，约600字，阅读约需2分钟。

📝

内容提要

深度神经网络在面部伪造检测中性能提高，但受到后门攻击威胁。研究自然触发器，提出基于合成分析的后门攻击方法。实验证明方法在攻击成功率、后门防御和人工检查方面具有优势。

🎯

关键要点

深度神经网络在面部伪造检测中性能显著提高，但面临后门攻击威胁。
提出基于合成分析的后门攻击方法，研究自然触发器的嵌入潜在空间。
从模型区分和数据分布两个角度深入研究后门漏洞。
使用优化的触发器最小化交叉熵损失找到触发器。
通过操纵长尾分布生成没有检测模型监督的污染样本。
采用领先的StyleGAN和Stable Diffusion进行触发器生成。
后门触发器引入特定语义特征，使生成样本更自然、更健壮。
实验证明方法在攻击成功率、后门防御和人工检查方面具有优越性。
攻击成功率超过99%，低污染率下模型准确性下降小于0.2%。
方法在面对现有后门防御时显示出更好的鲁棒性。
综合用户研究表明方法对人视觉更不敏感。

🏷️

标签

合成分析后门攻击深度神经网络自然触发器触发器面部伪造检测

➡️

继续阅读

在AI帮助下黑客在漏洞公布数小时后就针对WordPress发起远程代码执行攻击
#安全资讯在漏洞公布数小时后，黑客就利用 AI 成功发掘 WordPress 高危安全漏洞并发起攻击，部分网站可能会被黑客添加管理员账号或在服务器上部署...
XZ 后门这件事，最该记住的不是 0.5 秒
XZ Utils 后门再次提醒我们，供应链安全不只是一套扫描工具能解决的问题。真正容易被忽略的，是维护者压力、构建链路、发布包和线上异常之间那些不起眼的缝。
Single-pass AI code isn’t dead, but “high-reasoning” is the next frontier
Ask an AI model what comes next after “bacon-double”, and the return is fairl...
Microsoft is building an AI stack it doesn’t fully own — on purpose
Microsoft and Mistral are deepening their partnership with a multibillion-dol...
Introducing the ChatGPT for small business program
OpenAI launches the ChatGPT for Small Businesses program, helping entrepreneu...
What’s new: Air gets more agents, local models, and Java/Kotlin code intelligence
The new release of JetBrains Air brings support for GitHub Copilot, OpenCode,...