TM-TREK 参加 SemEval-2024 任务 8:面向基于 LLM 的人机混合文本自动边界检测
原文中文,约300字,阅读约需1分钟。发表于: 。本文研究了大型语言模型在辨别人工写作文本和模型生成文本中的能力,通过将此任务转化为标记分类问题并将标记转折点视为边界来处理。其中,我们的语言模型集成模型在 SemEval'24 竞赛第 8 任务的 “人机混合文本检测” 子任务中取得了第一名,同时我们还研究了一些影响大型语言模型检测混合文本边界能力的因素,包括在语言模型基础上增加附加层、结合分割损失以及预训练的影响。本研究结果对未来研究提供了有价值的见解。
本研究探讨了大型语言模型在辨别人工写作文本和模型生成文本中的能力,并在SemEval'24竞赛中获得第一名。研究还分析了影响大型语言模型检测混合文本边界能力的因素,对未来研究具有重要价值。