本研究提出了一种交叉熵攻击方法,旨在解决黑箱文本对抗攻击中的模型信息缺乏和文本离散性问题。通过优化软标签和硬标签的对抗目标,实验证明该方法在攻击性能、不可察觉性和句子质量上具有显著优势。
本研究提出了一种创新的超图攻击方法(IE-Attack),通过向精英超边注入同质节点,提升了超图神经网络的攻击性能和隐蔽性,实验结果验证了其优越性。
本文提出多种对抗攻击方法,旨在提高对抗样本的传递性和攻击性能。研究包括特征重要性感知攻击、输入变换攻击和竞争对抗元素优化等,实验结果表明这些方法在不同数据集上优于现有技术,增强了对抗攻击的有效性。
本文探讨了普适对抗触发器的生成及其在文本分类器中的攻击性能。研究表明,利用对抗正则化自编码器和梯度搜索等技术,可以生成更自然的攻击短语,难以被检测。此外,提出了针对事实核查系统的攻击方法,并验证了其在大型语言模型上的有效性,强调了防御技术的重要性。
本文提出了一种以指令为导向的有针对性攻击方法,通过将目标响应转化为目标图像,并从目标响应推断出合理的指令。该方法利用共享相同视觉编码器的本地替代模型来提取对抗示例和目标图像的指令感知特征,并优化对抗示例以最小化这两个特征之间的距离,从而提高攻击性能和可迁移性。
完成下面两步后,将自动完成登录并继续当前操作。