小红花·文摘

本文提出了一种新的成员推断攻击方法LBRM，旨在解决生成模型在时间序列插补中无意记忆训练数据的问题。该方法通过参考模型提高了攻击的准确性，未调优时AUROC提升约40%，调优后提升至约60%，有效应对隐私风险。

A New Membership Inference Attack Method: Loss-Based with Reference Model Algorithm (LBRM) Revealing Memorization Phenomena in Generative and Predictive Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的贝叶斯成员推断攻击方法（BMIA），通过贝叶斯推断进行条件攻击，仅需一个参考模型，显著降低计算消耗，提高成员推断的准确性和效率。

Efficient Membership Inference Attacks Based on Bayesian Neural Networks

BriefGPT - AI 论文速递 ·

本文提出了一种新方法，解决了在缺乏目标模型超参数知识时的成员推断攻击（MIA）局限性。通过匹配目标模型与影子模型的输出分布来选择影子模型的超参数，实现了几乎无差异的攻击性能。此外，研究表明，差分隐私转移学习中未考虑的隐私风险对MIA脆弱性影响不大。

基于评分的成员推断攻击中的超参数

BriefGPT - AI 论文速递 ·

本研究分析了成员推断攻击（MIA）在大语言模型中的局限性，指出合成数据可能导致错误的模型记忆和数据泄漏，强调评估时需谨慎。

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型中的成员推断攻击（MIA）性能不一致的问题。通过数千次实验的统计分析，发现样本分布差异是主要原因。研究指出模型规模、文本特征和解码动态等因素影响MIA表现，并提出了阈值决策的挑战，为提高MIA准确性提供了新见解。

A Statistical and Multi-Perspective Revisiting of the Membership Inference Attack in Large Language Models

BriefGPT - AI 论文速递 ·

本研究探讨了长上下文大语言模型（LCLMs）在隐私风险方面的不足，提出了六种有效的成员推断攻击策略，揭示了LCLMs的成员泄露风险。

Membership Inference Attack against Long-Context Large Language Models

BriefGPT - AI 论文速递 ·

本研究针对大规模视觉-语言模型（VLLMs）提出了成员推断攻击（MIA）基准，开发了专门的MIA管道，并引入了新指标MaxR'enyi-K%。旨在提高对VLLMs中敏感数据的检测能力，增强对成员推断攻击的理解。

Membership Inference Attacks against Large Vision-Language Models

BriefGPT - AI 论文速递 ·

本研究分析了合成面孔数据集的隐私泄露问题，发现存在真实数据泄露样本，并设计了有效的成员推断攻击，揭示了合成面孔识别数据集的隐私风险。

揭示合成面孔：合成数据集如何暴露真实身份

BriefGPT - AI 论文速递 ·

本研究提出MGMD-GAN框架，通过将训练数据不重叠划分来学习混合分布，减少泛化差距，提高对成员推断攻击的抵抗力。实验结果表明，该模型在安全性上更具韧性，具有重要应用潜力。

MGMD-GAN: Generalization Improvement of Generative Adversarial Networks Against Membership Inference Attacks

BriefGPT - AI 论文速递 ·

本文介绍了一种隐私保护机制，旨在提高机器学习模型的鲁棒性，防止成员推断攻击。研究提出了新的隐私风险得分指标和防御方法，实验结果表明该机制有效降低隐私泄露风险，同时保持模型的分类性能。

通过隐私感知稀疏性调优防御成员推断攻击

BriefGPT - AI 论文速递 ·

本文介绍了一种针对检索增强生成（RAG）系统的成员推断攻击（MIA）方法，展示了其在黑盒和灰盒设置下的有效性。研究强调了保护检索数据库隐私的重要性，并提出了新攻击方式和防御需求。通过注入恶意文档，攻击者可操控大型语言模型生成特定答案，探讨了RAG技术的潜在风险与未来研究方向。

视可知：针对检索增强生成的黑盒成员推断攻击

BriefGPT - AI 论文速递 ·

本文探讨了基于自校准概率变异的成员推断攻击（SPV-MIA），分析了大型语言模型在此类攻击中的脆弱性，并提出了改进的攻击方法和防御措施。研究显示，医疗笔记模型的隐私风险显著增加，现有防御措施效果有限。同时，提供了统一的基准测试套件以支持未来研究。

嘈杂邻居：针对 LLMs 的高效成员推断攻击

BriefGPT - AI 论文速递 ·

本文研究了生成模型的成员推断攻击，验证了多种生成模型的隐私泄漏风险。发现图神经网络中的结构信息是主要泄漏原因，并提出有效防御方法，降低攻击准确率60%。同时探讨数据集特性与攻击脆弱性之间的关系，强调生成模型设计中的隐私保护重要性。

GLiRA: 通过知识蒸馏进行的黑盒成员推理攻击

BriefGPT - AI 论文速递 ·

本文探讨了一种新的成员推断攻击方法（SPV-MIA），旨在检测敏感数据泄露。研究表明，现有攻击方法存在高误报率，提出的新算法显著提高了假阳性率。通过分析影响攻击成功的因素，建议使用数据集属性作为正则化器，以降低攻击准确率，同时保持模型的预测效果。

通过扰动损失特征提升自动语音识别模型审计中的成员推断

BriefGPT - AI 论文速递 ·

本文探讨了基于自校准概率变异的成员推断攻击（SPV-MIA），揭示了大型语言模型在隐私保护方面的脆弱性。研究表明，特别是在医疗数据上，成员推断攻击的成功率显著提高。文章还提出了保护模型免受此类攻击的措施，并强调处理敏感数据时的谨慎。

基于采样的伪似然函数在成员推断攻击中的应用

BriefGPT - AI 论文速递 ·

该文介绍了一种隐私机制，用于训练机器学习模型以保证隐私，并使用敌对训练算法提高模型的鲁棒性和泛化性能。测试结果表明，该机制可以显著降低成员推断攻击的风险。

防范 GANs 中的成员推断攻击以保护隐私

BriefGPT - AI 论文速递 ·

该研究探讨了深度神经网络过拟合的新认识，并研究了成员推断攻击。攻击方法可校准，且可以进行高精度的成员推论。较小的一阶差分隐私不能防止攻击，而较大的隐私预算则使攻击几乎与未受保护的模型相同。

本文研究了扩散模型在音频生成等任务中的隐私问题，并提出了一种查询式基础的成员推断攻击 (MIA)，即近端初始化攻击 (PIA)。实验结果表明，该方法可以在离散时间和连续时间扩散模型中仅使用两个查询便实现了竞争性能。同时，本研究还首次研究了扩散模型在文本转语音 (TTS) 任务中对成员推断攻击的鲁棒性。实验结果表明，具有 mel-spectrogram 输出的模型容易受到 MIA 攻击，而具有音频输出的模型相对较为鲁棒。

基于概率波动的生成模型成员推断攻击

BriefGPT - AI 论文速递 ·

A New Membership Inference Attack Method: Loss-Based with Reference Model Algorithm (LBRM) Revealing Memorization Phenomena in Generative and Predictive Models

Efficient Membership Inference Attacks Based on Bayesian Neural Networks

基于评分的成员推断攻击中的超参数

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

A Statistical and Multi-Perspective Revisiting of the Membership Inference Attack in Large Language Models

Membership Inference Attack against Long-Context Large Language Models

Membership Inference Attacks against Large Vision-Language Models

揭示合成面孔：合成数据集如何暴露真实身份

MGMD-GAN: Generalization Improvement of Generative Adversarial Networks Against Membership Inference Attacks

通过隐私感知稀疏性调优防御成员推断攻击

视可知：针对检索增强生成的黑盒成员推断攻击

嘈杂邻居：针对 LLMs 的高效成员推断攻击

GLiRA: 通过知识蒸馏进行的黑盒成员推理攻击

通过扰动损失特征提升自动语音识别模型审计中的成员推断

基于采样的伪似然函数在成员推断攻击中的应用

防范 GANs 中的成员推断攻击以保护隐私

为什么要训练更多？通过记忆进行有效和高效的成员推断

基于概率波动的生成模型成员推断攻击