追踪文本起源的 RoBERTa-BiLSTM 方法: Mast Kalandar 在 SemEval-2024 任务 8 中探测生成的 AI 文本
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究介绍了UniBuc-NLP团队在SemEval 2024任务8中使用基于transformer和混合深度学习架构的模型。在子任务B中取得了强势的第二名,但在子任务A和C中出现了过拟合的问题。
🎯
关键要点
- UniBuc-NLP团队应对SemEval 2024任务8,探索基于transformer和混合深度学习架构的方法。
- 在子任务B中,基于transformer的模型以86.95%的准确度获得第二名。
- 子任务A中模型出现过拟合现象,可能通过减少微调和增加最大序列长度来修复。
- 在子任务C中,混合模型在训练过程中出现过拟合,影响了检测人工文本和机器生成文本的能力。
➡️