研究表明,会员推断攻击对大型语言模型(LLMs)构成严重隐私风险。攻击者可以通过模型输出判断特定数据是否用于训练。细调模型因其强记忆能力更易受到攻击。为此,提出了一种新方法EZ MIA,通过分析模型错误预测位置的概率变化来评估记忆泄露风险。研究发现,使用LoRA细调可显著降低隐私泄露风险。
完成下面两步后,将自动完成登录并继续当前操作。