Archimedes-AUEB 参与 SemEval-2024 任务 5:LLM 解释民事诉讼程序
原文中文,约300字,阅读约需1分钟。发表于: 。使用强大的 ChatGPT 模型作为教师模型,通过生成解释和合成数据来扩展训练数据集,并利用生成的数据微调一个小型学生模型。与以往的工作不同,我们的解释不是直接来自教师模型的内部知识,而是基于真实人类分析,从而提供出更优的推理信号。还使用一种新的 “变异” 方法生成受现有数据启发的人工数据实例。我们公开发布这些解释作为原始数据集的扩展,以及用于生成两者的提示。我们的系统在 SemEval...
SCaLAR团队在SemEval-2024任务5中提出了一种基于相似度和距离的无监督方法来生成标签,解决二元分类任务。他们使用CNN、GRU和LSTM等特征和Legal-Bert嵌入来解决法律文本复杂性的问题。通过引入基于T5的分段摘要,他们提高了模型性能。无监督系统在开发集和测试集上都取得了显著提高。