基于差分隐私相关性的特征选择
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对高维数据集中重要特征识别的难题,指出传统两阶段选择技术在稀疏情况下不稳定,导致其在实际数据集上的表现不佳。通过引入基于相关性的排序统计方法进行特征选择并进行隐私保护,我们的方法在多个数据集上显著优于现有基准,为私密特征选择提供了新的解决方案。
本文首次探索了在公共特征下的局部差分隐私(LDP)学习,提出了半特征LDP概念,并证明了其在非参数回归中的收敛速度明显降低。介绍了HistOfTree估计器,能够利用公共和私有特征信息,在理论和实证中表现出优越性能。还讨论了用户手动选择保护特征的情况,并提出了相应的估计器和参数调整策略,得到了类似的理论和实证结果。