我的文本在你的人工智能模型中吗?基于梯度的成员推断测试应用于大型语言模型

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

本研究提出了一种基于梯度的成员推断测试(gMINT),用于判断特定文本是否被用于训练大型语言模型。实验结果显示,gMINT在七个基于Transformer的模型上表现出高鲁棒性,AUC得分在85%到99%之间,为数据隐私保护提供了可靠的审计工具。

🎯

关键要点

  • 本研究提出了一种基于梯度的成员推断测试(gMINT),用于判断特定文本是否被用于训练大型语言模型。

  • gMINT在七个基于Transformer的模型上表现出高鲁棒性,AUC得分在85%到99%之间。

  • gMINT为数据隐私保护提供了可靠的审计工具,确保机器学习模型的透明度和敏感数据的保护。

➡️

继续阅读