LegalSeg:通过修辞角色分类解锁印度法律判决的结构
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了LegalSeg数据集,包含7000个文档和140万个句子,标注7种修辞角色。结果显示,考虑上下文和结构关系的模型在分类准确性上优于仅依赖句子特征的模型。
🎯
关键要点
- 本研究针对法律文件的语义分割问题,专注于印度法律判决。
- 介绍了LegalSeg数据集,这是该领域最大的标注数据集,包含7000个文档和140万个句子。
- 数据集中标注了7种修辞角色。
- 研究结果表明,考虑上下文和结构关系的模型在分类准确性上优于仅依赖句子特征的模型。
- 展示了提高法律文档理解的先进技术潜力。
➡️