小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种新的成员推断攻击方法LBRM,旨在解决生成模型在时间序列插补中无意记忆训练数据的问题。该方法通过参考模型提高了攻击的准确性,未调优时AUROC提升约40%,调优后提升至约60%,有效应对隐私风险。

A New Membership Inference Attack Method: Loss-Based with Reference Model Algorithm (LBRM) Revealing Memorization Phenomena in Generative and Predictive Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出了一种新颖的贝叶斯成员推断攻击方法(BMIA),通过贝叶斯推断进行条件攻击,仅需一个参考模型,显著降低计算消耗,提高成员推断的准确性和效率。

Efficient Membership Inference Attacks Based on Bayesian Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本文提出了一种新方法,解决了在缺乏目标模型超参数知识时的成员推断攻击(MIA)局限性。通过匹配目标模型与影子模型的输出分布来选择影子模型的超参数,实现了几乎无差异的攻击性能。此外,研究表明,差分隐私转移学习中未考虑的隐私风险对MIA脆弱性影响不大。

基于评分的成员推断攻击中的超参数

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究分析了成员推断攻击(MIA)在大语言模型中的局限性,指出合成数据可能导致错误的模型记忆和数据泄漏,强调评估时需谨慎。

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

该研究探讨了大型语言模型中的成员推断攻击(MIA)性能不一致的问题。通过数千次实验的统计分析,发现样本分布差异是主要原因。研究指出模型规模、文本特征和解码动态等因素影响MIA表现,并提出了阈值决策的挑战,为提高MIA准确性提供了新见解。

A Statistical and Multi-Perspective Revisiting of the Membership Inference Attack in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究探讨了长上下文大语言模型(LCLMs)在隐私风险方面的不足,提出了六种有效的成员推断攻击策略,揭示了LCLMs的成员泄露风险。

Membership Inference Attack against Long-Context Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究针对大规模视觉-语言模型(VLLMs)提出了成员推断攻击(MIA)基准,开发了专门的MIA管道,并引入了新指标MaxR'enyi-K%。旨在提高对VLLMs中敏感数据的检测能力,增强对成员推断攻击的理解。

Membership Inference Attacks against Large Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究分析了合成面孔数据集的隐私泄露问题,发现存在真实数据泄露样本,并设计了有效的成员推断攻击,揭示了合成面孔识别数据集的隐私风险。

揭示合成面孔:合成数据集如何暴露真实身份

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出MGMD-GAN框架,通过将训练数据不重叠划分来学习混合分布,减少泛化差距,提高对成员推断攻击的抵抗力。实验结果表明,该模型在安全性上更具韧性,具有重要应用潜力。

MGMD-GAN: Generalization Improvement of Generative Adversarial Networks Against Membership Inference Attacks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文介绍了一种隐私保护机制,旨在提高机器学习模型的鲁棒性,防止成员推断攻击。研究提出了新的隐私风险得分指标和防御方法,实验结果表明该机制有效降低隐私泄露风险,同时保持模型的分类性能。

通过隐私感知稀疏性调优防御成员推断攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

本研究发现深度神经网络的过拟合问题,并研究了成员推断攻击。同时,发现小的一阶差分隐私无法防止攻击,而较大的隐私预算使攻击准确性接近未受保护的模型。

参数是否透露了比损失函数更多的关于成员推断的信息?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本论文研究了图神经网络的成员推断攻击,包括基于训练和基于阈值的攻击。实验评估发现,该攻击方法与图级分类任务的过拟合水平相关。

GLiRA: 通过知识蒸馏进行的黑盒成员推理攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

该文介绍了一种隐私机制,用于训练机器学习模型以保证隐私,并使用敌对训练算法提高模型的鲁棒性和泛化性能。测试结果表明,该机制可以显著降低成员推断攻击的风险。

防范 GANs 中的成员推断攻击以保护隐私

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z

该研究探讨了深度神经网络过拟合的新认识,并研究了成员推断攻击。攻击方法可校准,且可以进行高精度的成员推论。较小的一阶差分隐私不能防止攻击,而较大的隐私预算则使攻击几乎与未受保护的模型相同。

为什么要训练更多?通过记忆进行有效和高效的成员推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z

本文研究了扩散模型在音频生成等任务中的隐私问题,并提出了一种查询式基础的成员推断攻击 (MIA),即近端初始化攻击 (PIA)。实验结果表明,该方法可以在离散时间和连续时间扩散模型中仅使用两个查询便实现了竞争性能。同时,本研究还首次研究了扩散模型在文本转语音 (TTS) 任务中对成员推断攻击的鲁棒性。实验结果表明,具有 mel-spectrogram 输出的模型容易受到 MIA 攻击,而具有音频输出的模型相对较为鲁棒。

基于概率波动的生成模型成员推断攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码