本研究提出了一种新颖的自动校准成员推断攻击框架(ACMIA),旨在解决现有方法的高假阳性率和对参考模型的依赖问题。通过调节温度,ACMIA有效校准输出概率,增强了成员推断的可靠性和鲁棒性。
本研究探讨了长上下文大语言模型在隐私风险方面的不足,将长上下文视为敏感信息存储库。首次提出六种成员推断攻击策略,实验结果显示这些方法有效,揭示了显著的成员泄露风险。
提出了一种名为PartCrop的统一成员推断方法,通过剪裁图像中的对象部分来查询表征空间中的图像响应,以应对不同训练协议和结构的自监督模型的攻击。评估了早停和差分隐私这两种方法来防御PartCrop攻击,并提出了一种名为收缩裁剪尺度范围的个性化方法。
完成下面两步后,将自动完成登录并继续当前操作。