追踪文本起源的 RoBERTa-BiLSTM 方法: Mast Kalandar 在 SemEval-2024 任务 8 中探测生成的 AI 文本
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种基于 RoBERTa-BiLSTM 的分类器,用于将文本分为两个类别:人工智能生成或人类生成,并与基准方法进行了兼容研究以评估其有效性,从而促进了自动文本检测系统在解决机器生成文本滥用方面的发展。其中,我们的架构在 125 个参赛者中以 80.83% 的准确率排名第 46 名。
该研究介绍了UniBuc-NLP团队在SemEval 2024任务8中使用基于transformer和混合深度学习架构的模型。在子任务B中取得了强势的第二名,但在子任务A和C中出现了过拟合的问题。