SaulLM-7B:一款用于法律的创新大型语言模型
原文中文,约400字,阅读约需1分钟。发表于: 。本文介绍了 SaulLM-7B,一个专为法律领域设计的大型语言模型 (LLM),它具有 70 亿个参数,是第一个专门用于法律文本理解和生成的 LLM。利用 Mistral 7B 架构作为基础,SaulLM-7B 在超过 300 亿个标记的英文法律语料库上进行训练。SaulLM-7B 在理解和处理法律文件方面展现了最先进的能力。此外,我们提出了一种新颖的指导微调方法,利用法律数据集进一步提高...
最近,自然语言处理在法律领域面临挑战,如序列长度、专业词汇和数据不平衡。研究比较了三个通用语言模型在法律合同分类测试中的性能,发现需要更强大的法律领域语言模型。