小红花·文摘

本研究针对SemEval-2024 Task 8提出了一个系统，主要处理Subtask B，该系统旨在检测给定的全文是由人类撰写还是由特定的大型语言模型生成。团队AISPACE对基于Transformer的模型进行了微调研究，发现仅编码器模型表现出色。他们还采用了加权交叉熵损失函数和多模型集成的软投票策略来提高预测的可靠性。该系统在Subtask B中排名第一，为这个新挑战设立了基准。