文本分类器中的对抗攻击与维度

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

研究了机器学习算法的对抗性攻击,发现对抗性样本的嵌入维度与模型输入样本具有相同嵌入维度时的有效性之间存在很强的相关性,并设计了一种对抗性防御机制。通过使用各种固有维度的集成模型来阻止攻击,在多个数据集上测试了其有效性。同时,还研究了使用不同距离度量来衡量对抗性扰动的问题。

原文中文,约400字,阅读约需1分钟。
阅读原文