小红花·文摘

本研究发现大规模语言模型训练与私人数据集保护之间的矛盾，并提出了一种通过查询语言模型进行训练数据提取的攻击方法。成功提取了GPT-2训练数据中的个人信息和代码等敏感信息，揭示了训练数据存在的隐私和安全问题。需要进一步的技术防范措施。