本研究提出了一种新方法,通过优化鲁棒的风格特征空间,可靠地检测机器生成文本。研究表明,尽管模型经过优化,检测效果依然稳定,且随着样本增多,人机文本分布可明显区分,AURA指标有助于评估其重叠程度。
本文介绍了一种在自回归语言模型中种植水印的方法,该方法对扰动具有鲁棒性,并且不改变文本分布。实验证明该方法对各种释义攻击具有统计功率和鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。