本研究提出了一种新策略,通过微调低秩适配器,将水印直接嵌入AI生成文本的模型权重中,以增强透明度和责任感,并优化水印的可检测性。
研究人员通过对比两个预训练大型语言模型的得分,提出了一种新的 LLM 检测器 Binoculars,能够准确地发现机器生成的文本。Binoculars 在多种文档类型和情况下进行了全面评估,能够以低误报率检测到 ChatGPT 生成的文本。
完成下面两步后,将自动完成登录并继续当前操作。