小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新方法，通过优化鲁棒的风格特征空间，可靠地检测机器生成文本。研究表明，尽管模型经过优化，检测效果依然稳定，且随着样本增多，人机文本分布可明显区分，AURA指标有助于评估其重叠程度。

Optimized Language Models Designed to Deceive Detectors Still Exhibit Unique Styles (and How to Alter Them)

BriefGPT - AI 论文速递 ·

本文介绍了一种在自回归语言模型中种植水印的方法，该方法对扰动具有鲁棒性，并且不改变文本分布。实验证明该方法对各种释义攻击具有统计功率和鲁棒性。

WavMark: 音频生成的水印技术

BriefGPT - AI 论文速递 ·