我的文本在你的人工智能模型中吗?基于梯度的成员推断测试应用于大型语言模型
💡
原文中文,约700字,阅读约需2分钟。
📝
内容提要
本研究提出了一种基于梯度的成员推断测试(gMINT),用于判断特定文本是否被用于训练大型语言模型。实验结果显示,gMINT在七个基于Transformer的模型上表现出高鲁棒性,AUC得分在85%到99%之间,为数据隐私保护提供了可靠的审计工具。
🎯
关键要点
-
本研究提出了一种基于梯度的成员推断测试(gMINT),用于判断特定文本是否被用于训练大型语言模型。
-
gMINT在七个基于Transformer的模型上表现出高鲁棒性,AUC得分在85%到99%之间。
-
gMINT为数据隐私保护提供了可靠的审计工具,确保机器学习模型的透明度和敏感数据的保护。
➡️