自适应精调 Transformer 集成模型用于 LLM 生成文本检测
原文中文,约400字,阅读约需1分钟。发表于: 。大语言模型生成文本内容的多样性接近于人类的能力,因此为了避免潜在的风险如社交媒体上的假新闻,需要有效的假文本检测。本研究通过在内部和外部分布数据集上测试五种专门的基于 Transformer 的模型来研究它们在 LLM 生成文本检测任务中的性能和泛化能力。结果表明,单个基于 Transformer...
为了避免社交媒体上的假新闻,需要有效的假文本检测。本研究测试了五种基于Transformer的模型,发现单个分类器在内部数据集上表现良好,但在外部数据集上的泛化能力有限。使用自适应集成算法提高了准确率。结果表明自适应集成算法在LLM生成文本检测中有效。