BriefGPT - AI 论文速递 ·

梯度基于和任务无关的机器去学习 $abla τ$

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了一种机器遗忘算法，旨在高效移除已训练模型中特定数据的影响，以保护用户隐私。该算法通过选择少量样本进行任务适应，优于传统微调方法，并在多个数据集上验证了其有效性。同时，研究探讨了遗忘风险、查询复杂度及新指标的引入，以实现高效的隐私保护。

🎯

❓

机器遗忘算法旨在高效移除已训练模型中特定数据的影响，以保护用户隐私。

该算法通过选择少量样本进行任务适应，优于传统微调方法，在上下文学习方面表现更好。

细粒度 Top-K 和 Random-k 参数扰动是不精确的机器遗忘策略，旨在满足隐私需求，同时保持计算可行性。

通过引入遗忘率和记忆保留率的新指标来评估机器遗忘效果和模型的泛化能力。

机器遗忘算法面临的挑战包括在不改变剩余数据集知识的情况下丢弃关于“遗忘”数据的信息。

投影梯度去学习方法通过在与保留数据集不重要的梯度子空间相对正交的方向上更新模型，来高效地删除特定训练样本的影响。

🏷️