脆弱的巨人:理解模型对子群攻击的脆弱性

📝

内容提要

本研究针对机器学习模型在数据中毒攻击中的脆弱性,特别是子群体污染攻击,提出了一个理论框架,探讨模型复杂性如何影响对这些攻击的易感性。研究发现,过参数化的模型由于其较大的能力,容易记忆并错误分类特定的子群体,进而揭示出这些模型在现实世界中可能对边缘化或代表性不足的群体造成的显著风险。

➡️

继续阅读