小红花·文摘

本文提出了一种简单高效的解决方案，通过集成多个组成语言模型的预测来区分人工生成文本和人类作者文本。实验证明，该方法在生成文本分类上性能提升范围在0.5%到100%之间。研究还发现，替换商业限制的生成预训练变压器数据为其他开放语言模型生成的数据是可行的替代方法。此外，实验结果表明该集成方法可以有效处理新数据。