AISPACE 在 SemEval-2024 任务 8 上:用于检测多生成器机器生成文本的类平衡软投票系统

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究针对SemEval-2024 Task 8提出了一个系统,主要处理Subtask B,该系统旨在检测给定的全文是由人类撰写还是由特定的大型语言模型生成。团队AISPACE对基于Transformer的模型进行了微调研究,发现仅编码器模型表现出色。他们还采用了加权交叉熵损失函数和多模型集成的软投票策略来提高预测的可靠性。该系统在Subtask B中排名第一,为这个新挑战设立了基准。

🎯

关键要点

  • 本研究针对SemEval-2024 Task 8提出了一个系统,主要处理Subtask B。

  • 该系统旨在检测给定的全文是由人类撰写还是由特定的大型语言模型生成。

  • 研究团队AISPACE对基于Transformer的模型进行了系统的微调研究。

  • 比较了仅编码器、仅解码器和编码器-解码器模型的性能,发现仅编码器模型表现出色。

  • 应用了加权交叉熵损失函数来解决不同类别样本不平衡的问题。

  • 采用了多模型集成的软投票策略来提高预测的可靠性。

  • 系统在Subtask B中排名第一,为这个新挑战设立了最新的基准。

➡️

继续阅读