LAiW:中国法律大型语言模型基准(技术报告)
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了中国法学硕士综合评估基准,将法律能力分为三个层次,第一阶段评估结果显示存在差距。该基准测试可在URL上找到。
🎯
关键要点
- 提出了第一个基于法学能力的中国法学硕士综合评估基准。
- 法学硕士的法律能力分为三个层次:基本法律自然语言处理能力、基本法律应用能力和复杂法律应用能力。
- 第一阶段评估主要关注基本法律自然语言处理能力。
- 评估结果显示,部分法学硕士在性能上优于基础模型,但与ChatGPT相比仍存在差距。
- 基准测试可在指定URL上找到。
➡️