Apple Machine Learning Research ·

高效的隐私损失核算：针对子采样和随机分配

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

本文探讨了一种在k个步骤中随机均匀使用用户数据的采样方案，该方案在差分隐私优化和高维私有聚合中表现出优于标准泊松采样的效用。研究表明，随机分配的隐私损失分布可以高效计算，并且在训练DP-SGD时，其隐私效用权衡至少与泊松子采样相当。此外，本文开发了新的隐私损失核算工具，扩展了对子采样的准确核算。

🎯

🔎

在差分隐私的应用中，隐私损失核算是确保用户数据安全的关键。本文提出的新工具能够更准确地计算隐私损失，尤其是在子采样的情况下，这对于提高数据处理的效率和安全性具有重要意义。

随机分配的隐私效用权衡与传统的泊松子采样相当，甚至在某些情况下更优。这意味着在高维私有聚合和差分隐私优化中，采用随机分配可以更好地平衡隐私保护与数据利用效率，值得研究者关注。

尽管本文的理论分析为隐私损失提供了新的视角，但仍存在一些局限性，例如隐私参数的紧凑性不足。这提示研究者在实际应用中需谨慎评估这些参数，以避免潜在的隐私风险。

❓

随机均匀采样方案是在k个步骤中随机选择用户数据，旨在提高差分隐私的效用。

该方案在差分隐私优化和高维私有聚合中表现出优于标准泊松采样的效用。

随机分配的隐私损失分布可以通过新开发的工具高效计算，适用于任何差分隐私算法。

随机分配的隐私效用权衡至少与泊松子采样相当，甚至在某些情况下更优。

本文开发了新的隐私损失核算工具，扩展了对子采样的准确核算。

在训练DP-SGD时，随机分配的隐私效用权衡优于传统方法，适合高效训练。

🏷️