PostMark: 大型语言模型的稳健黑盒水印
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们开发了PostMark,一种模块化的事后水印程序,可以在解码后将依赖于输入的词语插入到文本中,对释词攻击更鲁棒,并通过评估其对文本质量的影响来权衡质量和抗释词性。
🎯
关键要点
-
开发了PostMark,一种模块化的事后水印程序。
-
PostMark可以在解码后插入依赖于输入的词语。
-
PostMark无需访问对数,增强了鲁棒性。
-
与现有水印方法相比,PostMark对释词攻击更具鲁棒性。
-
通过自动和人工评估,评估PostMark对文本质量的影响。
-
突出了质量与抗释词性之间的权衡。
➡️