绿盟科技技术博客 ·

浅析Machine Unlearning

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

随着机器学习模型在产品中的应用，机器学习逐渐成为人们熟悉的概念。机器遗忘是解决模型遗忘和用户隐私保护的方法，包括SISA和Fisher forgetting两种方案。SISA通过分布式训练和聚合子模型实现遗忘，Fisher forgetting通过Newton校正和噪声注入实现遗忘。机器遗忘可应用于合规政策、对抗攻击、优化模型和缓解过度学习等场景。然而，机器遗忘可能存在隐私窃取和攻击风险，因此需要综合考虑其他方案来保障模型的鲁棒性。

🎯

关键要点

机器学习逐渐成为人们熟悉的概念，机器遗忘是解决模型遗忘和用户隐私保护的方法。
GDPR规定用户享有“被遗忘权”，企业需合理措施及时销毁用户个人数据。
Machine unlearning旨在让模型有效遗忘指定训练数据，保护用户数据隐私。
SISA方案通过分布式训练和聚合子模型实现遗忘，提供较强的隐私保障。
Fisher forgetting方案通过Newton校正和噪声注入实现近似遗忘，效率较高。
Machine unlearning可用于满足合规政策、抵御对抗攻击、优化模型表现和缓解过度学习。
Machine unlearning可能存在隐私窃取和攻击风险，需要综合考虑其他方案保障模型鲁棒性。

🏷️

继续阅读

CatReader 上线：重启 RSS 阅读
CatReader是一款现代RSS阅读器，旨在帮助用户高效获取优质信息。它整合了博客、播客和音频等多种信源，支持智能助手AskCat，根据用户需求提供个性...
受人之托，然后呢
文章探讨了工作中的责任感与个人价值的关系。作者反思工作中的焦虑与消耗，认为并非所有尽责都有意义。工作应关注可控部分，避免责任无限扩大。通过主动创造与自我管...
掌握时间序列分析的七个步骤：使用Python
时间序列数据分析在各行业中需求旺盛，需掌握时间依赖性、平稳性和季节性等特性。文章介绍了七个步骤：理解时间序列特性、使用Python处理数据、数据清洗与准备...
Endava如何围绕AI代理重新设计软件交付
Endava是一家全球技术服务公司，专注于利用AI解决复杂商业问题。公司重新设计工作流程，推动AI在软件交付和日常运营中的应用，提升效率。AI不仅被开发团...
How a Culture of Data-Driven Conversations Can Support Platform Engineering
To provide SRE as a service, a team built a center of excellence, introducing...
从 CLOS 审视 Java 面向对象编程
本文探讨了 Common Lisp 的面向对象编程特性，特别是多态、封装和继承。作者对比了 Java 和 Common Lisp，指出 Java 的严格封...

浅析Machine Unlearning

内容提要

关键要点

标签

继续阅读