WavMark: 音频生成的水印技术
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文介绍了一种在自回归语言模型中种植水印的方法,该方法对扰动具有鲁棒性,并且不改变文本分布。实验证明该方法对各种释义攻击具有统计功率和鲁棒性。
🎯
关键要点
- 提出了一种在自回归语言模型中种植水印的方法,具有鲁棒性且不改变文本分布。
- 使用随机水印密钥生成带水印的文本,通过随机数序列映射到语言模型的样本。
- 检测带水印文本的方法是将文本与随机数序列对齐,任何知道密钥的一方都可以进行检测。
- 采用逆变换采样和指数最小采样两种方案来实例化水印方法。
- 在三个语言模型(OPT-1.3B,LLaMA-7B 和 Alpaca-7B)上进行实验,验证其对释义攻击的统计功率和鲁棒性。
- 在OPT-1.3B和LLaMA-7B模型中,即使破坏40-50%的标记,仍能可靠检测带水印文本(p≤0.01)。
- 对于Alpaca-7B模型,水印响应的检测较困难,约25%的响应可以在p≤0.01条件下检测到。
➡️