小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

当前大型语言模型(LLMs)的隐私审计技术效果有限,依赖基本方法生成无效信号,导致隐私泄漏检测能力不足。本研究开发的新检测信号在多种威胁模型下表现优越,显著提升了隐私保护效果。

大型语言模型的隐私审计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究提出了一种名为“Parsing”的主动隐私审计框架,旨在识别和量化监督微调过程中敏感数据和隐私泄漏风险。该框架通过改进的白盒会员推断攻击方法,提高了对大型语言模型(如GPT-2和Llama2)的隐私审计效果,为监督微调提供了可靠的隐私保护工具。

Active Privacy Auditing in Supervised Fine-tuning of White-Box Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本文研究了机器学习模型的隐私风险及成员推理攻击,提出了一种基于预测熵的攻击方法和隐私风险得分指标。研究发现,个体样本的隐私风险差异显著,主要受模型敏感性和特征嵌入的影响。提出的防御机制“用于成员隐私的蒸馏”能够有效平衡隐私与分类准确性。此外,隐私审计方案量化了大规模模型的隐私泄露,强调了数据集特性与攻击脆弱性之间的关系。

表示幅度对隐私脆弱性具有责任

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码