💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
本文研究了在联邦环境中如何为每个用户计算个性化的频率直方图估计,同时保护用户隐私。我们提出了一种基于聚类的非隐私算法,并给出了差分隐私的版本。通过对Reddit、StackOverflow和Amazon Reviews数据集的实证评估,结果表明我们的算法在统计异质性和规模异质性方面显著优于传统方法。
🎯
关键要点
-
研究个性化频率直方图估计问题,旨在保护用户隐私。
-
每个用户观察特定于自己的分布样本,目标是计算个性化的分布估计。
-
面临的主要挑战包括统计异质性和用户隐私保护。
-
提出了一种基于聚类的非隐私算法,并给出了差分隐私版本。
-
使用Dirichlet分布的混合模型来正式支持非隐私算法。
-
在Reddit、StackOverflow和Amazon Reviews数据集上进行了广泛的实证评估。
-
结果显示算法在统计异质性和规模异质性方面显著优于传统方法。
➡️