小红花·文摘 - 小红花技术领袖俱乐部

随机平滑是一种增强机器学习模型鲁棒性的方法，但攻击者可以利用其随机性进行后门攻击。本文提出两种攻击方式：简单攻击通过替换噪声分布，位翻转攻击则通过微调随机数生成器的位数，导致预测置信度严重失真。这表明现有防御措施无法有效应对复杂攻击，需加强对随机性来源的信任与防护。

基于伪随机数生成器的模型后门攻击

FreeBuf网络安全行业门户 ·

CBC中的位翻转攻击：初始化向量的改变

CBC中的位翻转攻击：初始化向量的改变

DEV Community ·

本研究提出了“注意力破坏者”框架，揭示大语言模型在位翻转攻击下的脆弱性，仅需三次位翻转即可显著降低模型性能，强调了安全性的重要性。

Attention Breaker: Adaptive Evolutionary Optimization Revealing Vulnerabilities in Large Language Models through Bit Flip Attacks

BriefGPT - AI 论文速递 ·