针对普通法系统的低资源法院判决摘要
原文中文,约300字,阅读约需1分钟。发表于: 。为了解决多个司法管辖区缺乏数据集的问题,我们提出了 CLSum,这是用于总结多司法管辖区普通法法院判决文件的第一个数据集。此外,本文还首次采用基于大型语言模型(LLM)的数据增强、摘要生成和评估方法来进行法院判决摘要研究,实验证明 LLM 方法在少样本和零样本设置下能够表现良好,同时本文还进行了全面的对比实验,找到能够提高摘要性能的关键模型组成部分和设置。
本研究提出了一种在低资源环境下提取法律决策摘要的技术,利用有限的专家注释数据。通过顺序模型定位相关内容,并利用最大边际相关性处理冗余,生成组合摘要。通过隐式方法帮助培训建议模型生成更多有信息量的摘要。多任务学习模型通过辅助任务提高摘要器性能。实验结果表明,该方法能够实现与专业提取的摘要相匹配的得分。