TAROT是一种新的无监督作者身份混淆方法,通过重新生成文本以优化隐私和实用性的权衡。该方法降低了攻击者的准确率,同时保护实用性。
最新大型语言模型的高质量文本生成能力引起了对其滥用的关注。机器生成文本的检测对应对此类威胁至关重要。通过全面基准测试,发现所有经过测试的作者身份混淆方法都可以导致检测逃避。
完成下面两步后,将自动完成登录并继续当前操作。