【差分隐私】基本原理与入门级应用 | 京东云技术团队

💡 原文中文,约2000字,阅读约需5分钟。
📝

内容提要

差分隐私是一种保护隐私的密码学手段,分为CDP和LDP。LDP需要对数据进行裁剪处理以得到有界全局敏感度,裁剪边界可以根据数据集性质或采用差分隐私问询估计选择。向量值Laplace机制需要使用L1敏感度,而向量值Gaussian机制L1和L2敏感度都可以使用。指数机制可以从备选回复集合中选出最佳结果并保证差分隐私。LDP是一种通过随机响应技术对数据进行扰动的保护隐私的技术。

🎯

关键要点

  • 差分隐私是一种保护隐私的密码学手段,分为CDP和LDP。

  • LDP需要对数据进行裁剪处理以得到有界全局敏感度。

  • 裁剪边界可以根据数据集性质或采用差分隐私问询估计选择。

  • 向量值Laplace机制需要使用L1敏感度,而向量值Gaussian机制L1和L2敏感度都可以使用。

  • 指数机制可以从备选回复集合中选出最佳结果并保证差分隐私。

  • LDP是一种通过随机响应技术对数据进行扰动的保护隐私的技术。

  • COUNT函数的全局敏感度始终为1,但SUM函数的全局敏感度依赖于属性列。

  • 裁剪处理需要在信息损失与满足差分隐私所需噪声之间进行权衡。

  • 裁剪边界不能通过查看数据集来确定,以避免泄露信息。

  • 属性列裁剪可以根据数据集性质或差分隐私问询估计选择边界。

  • 向量值Laplace和Gaussian机制的发布规则有所不同。

  • 指数机制通过返回分数近似最大的回复来实现差分隐私保护。

  • LDP经典算法通过对用户回答加数据扰动来保护隐私。

➡️

继续阅读