本文提出了一种新的成员推断攻击方法LBRM,旨在解决生成模型在时间序列插补中无意记忆训练数据的问题。该方法通过参考模型提高了攻击的准确性,未调优时AUROC提升约40%,调优后提升至约60%,有效应对隐私风险。
本研究提出了一种新颖的贝叶斯成员推断攻击方法(BMIA),通过贝叶斯推断进行条件攻击,仅需一个参考模型,显著降低计算消耗,提高成员推断的准确性和效率。
本文提出了一种新方法,解决了在缺乏目标模型超参数知识时的成员推断攻击(MIA)局限性。通过匹配目标模型与影子模型的输出分布来选择影子模型的超参数,实现了几乎无差异的攻击性能。此外,研究表明,差分隐私转移学习中未考虑的隐私风险对MIA脆弱性影响不大。
本研究分析了成员推断攻击(MIA)在大语言模型中的局限性,指出合成数据可能导致错误的模型记忆和数据泄漏,强调评估时需谨慎。
该研究探讨了大型语言模型中的成员推断攻击(MIA)性能不一致的问题。通过数千次实验的统计分析,发现样本分布差异是主要原因。研究指出模型规模、文本特征和解码动态等因素影响MIA表现,并提出了阈值决策的挑战,为提高MIA准确性提供了新见解。
本研究探讨了长上下文大语言模型(LCLMs)在隐私风险方面的不足,提出了六种有效的成员推断攻击策略,揭示了LCLMs的成员泄露风险。
本研究针对大规模视觉-语言模型(VLLMs)提出了成员推断攻击(MIA)基准,开发了专门的MIA管道,并引入了新指标MaxR'enyi-K%。旨在提高对VLLMs中敏感数据的检测能力,增强对成员推断攻击的理解。
本研究分析了合成面孔数据集的隐私泄露问题,发现存在真实数据泄露样本,并设计了有效的成员推断攻击,揭示了合成面孔识别数据集的隐私风险。
本研究提出MGMD-GAN框架,通过将训练数据不重叠划分来学习混合分布,减少泛化差距,提高对成员推断攻击的抵抗力。实验结果表明,该模型在安全性上更具韧性,具有重要应用潜力。
本文介绍了一种隐私保护机制,旨在提高机器学习模型的鲁棒性,防止成员推断攻击。研究提出了新的隐私风险得分指标和防御方法,实验结果表明该机制有效降低隐私泄露风险,同时保持模型的分类性能。
本研究发现深度神经网络的过拟合问题,并研究了成员推断攻击。同时,发现小的一阶差分隐私无法防止攻击,而较大的隐私预算使攻击准确性接近未受保护的模型。
本论文研究了图神经网络的成员推断攻击,包括基于训练和基于阈值的攻击。实验评估发现,该攻击方法与图级分类任务的过拟合水平相关。
该文介绍了一种隐私机制,用于训练机器学习模型以保证隐私,并使用敌对训练算法提高模型的鲁棒性和泛化性能。测试结果表明,该机制可以显著降低成员推断攻击的风险。
该研究探讨了深度神经网络过拟合的新认识,并研究了成员推断攻击。攻击方法可校准,且可以进行高精度的成员推论。较小的一阶差分隐私不能防止攻击,而较大的隐私预算则使攻击几乎与未受保护的模型相同。
本文研究了扩散模型在音频生成等任务中的隐私问题,并提出了一种查询式基础的成员推断攻击 (MIA),即近端初始化攻击 (PIA)。实验结果表明,该方法可以在离散时间和连续时间扩散模型中仅使用两个查询便实现了竞争性能。同时,本研究还首次研究了扩散模型在文本转语音 (TTS) 任务中对成员推断攻击的鲁棒性。实验结果表明,具有 mel-spectrogram 输出的模型容易受到 MIA 攻击,而具有音频输出的模型相对较为鲁棒。
完成下面两步后,将自动完成登录并继续当前操作。