基于统计的深度检测机器生成文本
原文中文,约300字,阅读约需1分钟。发表于: 。我们介绍了 STADEE,一种基于统计数据的深度检测方法,用于识别机器生成的文本,解决了当前方法在依赖大量微调预训练语言模型方面的局限性。STADEE 将关键的统计文本特征与深度分类器相结合,重点关注诸如标记概率和累积概率等方面,这对于处理核心采样非常关键。在不同的数据集和场景(领域内、领域外和实际环境)中进行测试,STADEE 表现出优异的性能,在领域内达到了 87.05% 的 F1...
STADEE是一种用于识别机器生成的文本的基于统计数据的深度检测方法。它结合了统计文本特征和深度分类器,重点关注标记概率和累积概率等方面。在不同的数据集和场景中测试,STADEE表现出优异的性能,特别是在领域外和实际环境中。