LEGAL-UQA:一个低资源的乌尔都语-英语法律问答数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
团队SCaLAR在《SemEval-2024任务5》中提出了一种无监督方法,通过相似度和距离生成标签,解决法律论证的二元分类问题。结合CNN、GRU、LSTM和Legal-Bert嵌入,处理法律文本复杂性。引入基于T5的分段摘要,提升模型性能。无监督系统在开发集和测试集上分别提高了20和10个百分点,显示了其有效性。
🎯
关键要点
- 团队SCaLAR在《SemEval-2024任务5》中提出了一种无监督方法,解决法律论证的二元分类问题。
- 该方法基于相似度和距离生成标签,结合CNN、GRU、LSTM和Legal-Bert嵌入处理法律文本复杂性。
- 引入基于T5的分段摘要,成功保留关键信息,提升模型性能。
- 无监督系统在开发集和测试集上的宏F1得分分别提高了20和10个百分点,显示了其有效性。
➡️