量子位 ·

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

研究表明，量化技术可以使大模型在遗忘特定知识后重新恢复这些知识。宾夕法尼亚州立大学、哈佛大学和亚马逊的研究发现，4-bit量化会导致被遗忘的知识重新显现。为了解决这一问题，提出了SURE框架，通过显著性图指导遗忘过程，以优化模型效用与遗忘性能的平衡。

🎯

🔎

量化技术在提升模型效率的同时，也可能导致隐私内容的恢复。研究表明，4-bit量化会使被遗忘的知识重新显现，这对数据隐私保护提出了新的挑战。用户在使用量化模型时需关注其可能带来的隐私风险，尤其是在处理敏感信息时。

SURE框架通过显著性图指导遗忘过程，选择性地使用较大的学习率，从而有效防止量化后知识的恢复。这一方法为反学习领域提供了新的思路，未来可能在模型训练和隐私保护中发挥重要作用，值得研究者深入探讨和应用。

现有的反学习方法在保持模型效用的同时，往往使用较小的学习率，导致模型权重变化不大。这使得量化后的模型容易恢复被遗忘的知识。研究者需关注这一局限性，并探索更有效的策略，以确保模型在遗忘特定知识时的可靠性。

❓

量化技术可以使大模型在遗忘特定知识后重新恢复这些知识，尤其是4-bit量化会导致被遗忘的知识重新显现。

SURE框架通过显著性图指导遗忘过程，优化模型效用与遗忘性能的平衡，防止量化后知识恢复。

4-bit量化会显著恶化遗忘性能，导致被遗忘知识的恢复比例从21%上升到83%，而8-bit量化的影响相对较小。

现有的反学习方法包括梯度上升（GA）和负向偏好优化（NPO），通常采用较小的学习率以保持模型性能。

在量化过程中，模型参数的微小变化可能导致原始模型权重与量化后模型权重相同，可能使得某些知识未真正丢失，只是被隐藏。

研究人员通过在NEWS和BOOKS等基准数据集上使用逐字记忆、知识记忆、隐私泄露和保留集效用等四个评估指标来评估反学习方法的效果。

🏷️