LAiW:中国法律大型语言模型基准(技术报告)

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文介绍了中国法学硕士综合评估基准,将法律能力分为三个层次,第一阶段评估结果显示存在差距。该基准测试可在URL上找到。

🎯

关键要点

  • 提出了第一个基于法学能力的中国法学硕士综合评估基准。
  • 法学硕士的法律能力分为三个层次:基本法律自然语言处理能力、基本法律应用能力和复杂法律应用能力。
  • 第一阶段评估主要关注基本法律自然语言处理能力。
  • 评估结果显示,部分法学硕士在性能上优于基础模型,但与ChatGPT相比仍存在差距。
  • 基准测试可在指定URL上找到。
➡️

继续阅读