小红花·文摘

高效的隐私损失核算：针对子采样和随机分配

Apple Machine Learning Research ·

本文提出了一种名为FFT增强卡尔曼滤波器（FFTKF）的差分隐私优化方法，旨在解决DP-SGD中噪声导致模型效用下降的问题。FFTKF结合频域噪声塑形与卡尔曼滤波，提升了梯度质量，保持了差分隐私保证，显著提高了测试准确性。

Spectral and Temporal Differential Privacy Optimization Denoising

BriefGPT - AI 论文速递 ·

本研究探讨了DP-SGD训练中噪声对梯度方向的负面影响，提出了几何扰动策略GeoDP，显著提高模型效率，减少方向噪声，同时确保隐私保护。实验结果表明，该方法在多个数据集和模型上均有效。

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露？ ETH有了新发现

机器之心 ·

本研究探讨了DP-SGD超参数对隐私保护机器学习算法性能的影响，揭示了剪切阈值与学习率之间的关系，并量化了其重要性，为优化隐私与效用的权衡提供了新思路。

R+R: Understanding the Impact of Hyperparameters in DP-SGD

BriefGPT - AI 论文速递 ·

本文介绍了一种新的Rényi差分隐私（RDP）界限，适用于DP-SGD变体。该界限适用于不假设凸性、平滑性或Lipschitz连续性的损失函数，并且假设DP-SGD的步长相对较小且损失函数是弱凸的。界限在目标函数的弱凸参数趋近于零时趋于以前建立的凸界限。对于非Lipschitz平滑的损失函数，提供了一种随着DP-SGD迭代次数的扩展良好的界限。

损失加大：对于非凸损失的隐藏状态 DP-SGD 没有隐私放大

BriefGPT - AI 论文速递 ·

通过实证研究，调查了DP-SGD和PATE在防止后门攻击方面的有效性，并首次检验了PATE在文献中的作用。实验揭示了超参数和训练数据集中后门数量对DP算法成功的影响。提出了Label-DP作为DP-SGD和PATE的更快、更准确的替代方法。准确的超参数调整可以使Label-DP在防御后门攻击并保持模型准确性方面更有效。

PATE-GAN 复制的艰难追求：基准测试、审计、调试

BriefGPT - AI 论文速递 ·

研究发现，批量大小对DP-SGD中的总梯度方差有影响。子抽样引起的方差随批量大小增加而减小，大批量可以减小有效总梯度方差。实验证实了渐近区域的相关性，并发现总梯度方差随大批量增加而进一步减小。找到了大批量同样可以减小DP-SGD迭代的有效随机噪声方差的条件。

通过使用预训练的语言模型、非标准化超参数和fine-tuning目标结合DP优化技术，可以在中等规模的语料库上获得胜过强基线和同一隐私预算下的DP-trained模型的NLP模型。同时，提出了一种内存节省技术来解决在大型Transformers上运行DP-SGD的计算难题，该技术可以使得clip在DP-SGD中运行而无需对模型中的任何线性层实例化每个样本的梯度，成本与非隐私的训练相当，并且有适度的运行时间开销。