好、坏与丑:水印、可转移攻击与对抗防御

📝

内容提要

本研究针对现有背包水印和对抗防御的定义进行了形式化和扩展,强调它们与学习任务的内在联系。关键发现是,对于几乎所有的判别学习任务,至少存在水印或对抗防御中的一种,同时引入了可转移攻击的概念,表明存在高效算法可以伪装成数据分布,从而欺骗所有高效的防御机制。此研究不仅阐明了可转移攻击与加密学之间的等价性,也为处理特定类型的学习任务的防御策略提供了理论基础。

➡️

继续阅读