BriefGPT - AI 论文速递 ·

通过平坦性实现大型语言模型的隐私保护微调

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了一种针对大型语言模型（LLM）的差分隐私（DP）微调框架ewtune，能够有效降低噪声影响并提升自然语言理解任务的性能。同时，研究提出了隐私保护语言模型（PPLM）及其他技术，以保护数据隐私并提高模型性能，并探讨了差分隐私与公平性之间的关系。

🎯

❓

ewtune框架通过直接降低噪声影响，在自然语言理解任务上将大型语言模型的性能提高了1.1%。

PPLM通过有效注入特定领域知识来保护数据隐私，解决个人身份信息的敏感度问题。

研究发现差分隐私机制可能加剧性别、种族和宗教偏见，但反事实数据增强法可以缓解这一问题。

可以使用更简单、更稀疏、更快速的算法来实现大规模预训练语言模型的差分隐私微调，平衡隐私与实用性。

DP-ZO方法通过对零阶优化中的步长进行隐私化，提供强大的隐私-效用权衡，且性能损失较小。

通过微调基于公共语料库的模型，可以实现高质量和隐私保护的语言模型，提高私有领域的模型性能。

🏷️