通过稀有事件模拟对语言模型的交叉熵攻击

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种交叉熵攻击方法,旨在解决黑箱文本对抗攻击中的模型信息不足和文本离散性问题。实验结果表明,该方法在攻击性能、不可察觉性和句子质量方面表现优越。

🎯

关键要点

  • 本研究提出了一种交叉熵攻击方法。
  • 该方法旨在解决黑箱文本对抗攻击中的模型信息不足和文本离散性问题。
  • 现有方法的通用性和性能受限。
  • 交叉熵攻击方法利用交叉熵优化,定义了软标签和硬标签的对抗目标。
  • 大量实验证明该方法在攻击性能、不可察觉性和句子质量方面表现优越。
➡️

继续阅读