BriefGPT - AI 论文速递 ·

通过基于 Hessian-Free 的个体数据统计回忆实现高效的在线遗忘

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了机器遗忘在用户数据隐私保护中的重要性，提出了基于噪声随机梯度下降的遗忘框架和选择性突触阻尼（SSD）方法。这些方法在优化计算效率和模型性能的同时，有效删除训练数据的影响，满足数据隐私法规要求。实验结果表明，这些新方法在隐私保护与模型效用之间取得了良好平衡。

🎯

❓

机器遗忘旨在高效地从训练模型中去除特定数据点的影响，以满足用户数据隐私的法律要求。

SSD方法以快速、高性能的方式进行遗忘，无需长期存储训练数据，且性能与基于重新训练的方法相当。

可以通过引入遗忘率和记忆保留率的新指标来评估机器遗忘效果和模型的泛化能力。

小批次梯度更新在隐私-复杂性权衡上优于全批次更新，具有复杂性节省和支持顺序与批次遗忘的优势。

这些策略旨在在保持计算开销的同时满足隐私需求，实现不精确的机器遗忘。

实验结果表明，新方法在隐私保护与模型效用之间取得了良好平衡，且在相同隐私限制下达到了类似的效用。

🏷️