本研究发现大规模语言模型训练与私人数据集保护之间的矛盾,并提出了一种通过查询语言模型进行训练数据提取的攻击方法。成功提取了GPT-2训练数据中的个人信息和代码等敏感信息,揭示了训练数据存在的隐私和安全问题。需要进一步的技术防范措施。
完成下面两步后,将自动完成登录并继续当前操作。