随着对深度学习隐私问题的关注增加,本文提出了一种新的知识删除概念及评估指标,并介绍了一种无训练的空间消除方法,有效实现知识的遗忘与保留平衡,实验结果表明其广泛适用性。
研究发现,微调遗忘方法在大型语言模型中无法彻底删除有害或敏感信息,只是影响了知识检索。需要更有效的技术来解决这个问题。
完成下面两步后,将自动完成登录并继续当前操作。