LEGAL-UQA:一个低资源的乌尔都语-英语法律问答数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

团队SCaLAR在《SemEval-2024任务5》中提出了一种无监督方法,通过相似度和距离生成标签,解决法律论证的二元分类问题。结合CNN、GRU、LSTM和Legal-Bert嵌入,处理法律文本复杂性。引入基于T5的分段摘要,提升模型性能。无监督系统在开发集和测试集上分别提高了20和10个百分点,显示了其有效性。

🎯

关键要点

  • 团队SCaLAR在《SemEval-2024任务5》中提出了一种无监督方法,解决法律论证的二元分类问题。
  • 该方法基于相似度和距离生成标签,结合CNN、GRU、LSTM和Legal-Bert嵌入处理法律文本复杂性。
  • 引入基于T5的分段摘要,成功保留关键信息,提升模型性能。
  • 无监督系统在开发集和测试集上的宏F1得分分别提高了20和10个百分点,显示了其有效性。
➡️

继续阅读