从零到英雄:通过合成数据注入和模型查询检测泄露数据
原文中文,约400字,阅读约需1分钟。发表于: 。为了保护数据的知识产权,在机器学习应用日益增多、且其成功与训练数据的质量密切相关的背景下,缺乏对未经授权的模型训练过程泄露数据的检测机制。本文针对表格数据领域,引入了一种名为局部分布偏移合成(LDSS)的新方法来检测训练分类模型所使用的泄露数据。LDSS 通过向拥有者的数据集注入一小部分具有局部类别分布偏移的合成数据,通过仅使用模型查询即可有效识别出训练于泄露和修改数据集的模型,且...
LDSS是一种新方法,用于检测训练分类模型所使用的泄露数据。它可以有效识别出训练于泄露和修改数据集的模型,且与各种分类模型都兼容。在五个真实世界数据集上进行了广泛实验,结果证实了LDSS的可靠性、稳健性、保真性、安全性和效率性。