BriefGPT - AI 论文速递 ·

AISPACE 在 SemEval-2024 任务 8 上：用于检测多生成器机器生成文本的类平衡软投票系统

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

SemEval-2024任务8聚焦于多语言和领域的机器生成文本检测。研究表明，使用变压器模型（如LoRA-RoBERTa）和对比学习方法，能够有效区分人工与机器生成文本。我们的最佳方法在多个子任务中取得了高准确率，并通过新系统T5LLMCipher提升了F1得分，强调了未来研究的挑战与重要性。

🎯

❓

SemEval-2024任务8的主要目标是识别多语言和领域中大型语言模型生成的机器文本。

使用LoRA-RoBERTa模型在多语言环境中能够高效识别机器生成的文本，准确率分别为86.9%和83.7%。

T5LLMCipher系统在9个不同生成器和领域中评估后，F1得分平均提高了19.6%。

对比学习方法通过数据增强，提升了单一模型的性能，使其与多模型的表现相当。

未来研究中强调了机器生成文本检测的挑战和重要性，尤其是在语义和句法方面的改进空间。

在子任务A中获得86.9%的准确率，在子任务B中获得83.7%的准确率。

🏷️