训练的随机森林完全揭示您的数据集
原文中文,约300字,阅读约需1分钟。发表于: 。我们介绍了一种基于优化的重建攻击,能够完全或近乎完全重建用于训练随机森林的数据集。我们将重建问题定义为一个组合优化问题,并通过最大似然目标函数来解决。通过广泛的计算研究,我们证明了即使在小规模树集的情况下,使用特征随机化的随机森林也容易被完全重建,这突显了广泛采用的集成方法固有的关键弱点,值得关注和缓解。虽然隐私研究中已经讨论了此类重建攻击的潜在性,但我们的研究提供了明确的实证证据。
本文介绍了一种基于优化的重建攻击,能够完全或近乎完全重建用于训练随机森林的数据集。通过最大似然目标函数解决重建问题,证明了即使在小规模树集的情况下,使用特征随机化的随机森林也容易被完全重建。这突显了集成方法的关键弱点,值得关注和缓解。