本研究提出了现代GBERT系列德国编码器模型,旨在满足资源有限时对编码器模型的需求。该模型在自然语言理解、文本嵌入和长上下文推理任务上表现优异,推动了德国NLP生态系统的发展。
本研究探讨了利用临床文本时间序列进行预测的方法,提出将基于时间戳的临床发现作为输入。实验结果表明,编码器模型在短期和长期预测中表现优异,时间排序的构建显著提升了模型性能,强调了时间序列构建的重要性。
本研究针对SemEval-2024 Task 8提出了一个系统,主要处理Subtask B,该系统旨在检测给定的全文是由人类撰写还是由特定的大型语言模型生成。团队AISPACE对基于Transformer的模型进行了微调研究,发现仅编码器模型表现出色。他们还采用了加权交叉熵损失函数和多模型集成的软投票策略来提高预测的可靠性。该系统在Subtask B中排名第一,为这个新挑战设立了基准。
本文介绍了 Gpachov 团队在 CLEF-2023 CheckThat!实验室任务 2 中构建的解决方案,旨在通过主观性检测确保社交网络上信息的客观性和质量。该解决方案采用了微调句子嵌入编码器模型和降维、样本高效少样本学习模型以及多语言数据集上微调多语言转换器等方法,并通过简单多数投票集成的方式融合三种方法,在测试集上达到 0.77 的宏 F1,并在英语子任务上获得第二名。
完成下面两步后,将自动完成登录并继续当前操作。