【差分隐私】基本原理与入门级应用 | 京东云技术团队
💡
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
差分隐私是一种保护隐私的密码学手段,分为CDP和LDP。LDP需要对数据进行裁剪处理以得到有界全局敏感度,裁剪边界可以根据数据集性质或采用差分隐私问询估计选择。向量值Laplace机制需要使用L1敏感度,而向量值Gaussian机制L1和L2敏感度都可以使用。指数机制可以从备选回复集合中选出最佳结果并保证差分隐私。LDP是一种通过随机响应技术对数据进行扰动的保护隐私的技术。
🎯
关键要点
-
差分隐私是一种保护隐私的密码学手段,分为CDP和LDP。
-
LDP需要对数据进行裁剪处理以得到有界全局敏感度。
-
裁剪边界可以根据数据集性质或采用差分隐私问询估计选择。
-
向量值Laplace机制需要使用L1敏感度,而向量值Gaussian机制L1和L2敏感度都可以使用。
-
指数机制可以从备选回复集合中选出最佳结果并保证差分隐私。
-
LDP是一种通过随机响应技术对数据进行扰动的保护隐私的技术。
-
COUNT函数的全局敏感度始终为1,但SUM函数的全局敏感度依赖于属性列。
-
裁剪处理需要在信息损失与满足差分隐私所需噪声之间进行权衡。
-
裁剪边界不能通过查看数据集来确定,以避免泄露信息。
-
属性列裁剪可以根据数据集性质或差分隐私问询估计选择边界。
-
向量值Laplace和Gaussian机制的发布规则有所不同。
-
指数机制通过返回分数近似最大的回复来实现差分隐私保护。
-
LDP经典算法通过对用户回答加数据扰动来保护隐私。
➡️