小红花·文摘

本研究提出了LegalAgentBench基准，用于评估法律领域LLM代理的性能。该基准结合17个语料库和37个工具，构建了300个任务，揭示了模型的优缺点及改进潜力。

Legal Intelligent Agent Benchmark: Evaluating LLM Agents in the Legal Domain

BriefGPT - AI 论文速递 ·

本研究提出CitaLaw基准，旨在提升大语言模型在法律领域生成合规回应的能力。通过整合法律引用，显著提高了法律答案的质量，并与人工评判高度一致，具有重要潜在影响。

CitaLaw: A Large Language Model Enhanced with Citations in the Legal Domain

BriefGPT - AI 论文速递 ·

本文研究领域特定计算问题，指出现有语言模型在处理复杂规则时的局限性。作者提出知识密集型程序生成器（KIPG），通过提取关键变量和利用领域知识有效解决问题，验证其在法律领域的有效性，并展示其在其他领域的适应潜力。

Using Knowledge-Intensive Program Generators to Address Domain-Specific Computational Problems

BriefGPT - AI 论文速递 ·

本文探讨了机器学习在法律领域的应用，比较了BERT、GPT-2和RoBERTa等模型在法律判决分类和信息提取中的表现。研究表明，尽管大型语言模型未经过专门训练，但仍能有效分类主题，然而其性能低于经过微调的小型模型，强调了开发更强大法律领域模型的必要性。

自然语言处理的小额索赔法庭：利用小数据集评判法律文本分类策略

BriefGPT - AI 论文速递 ·

本研究介绍了中国司法阅读理解数据集（CJRC），包含近1万份文档和5万道问题及答案。基于Bert和BiDAF构建的基准模型显示出与人工标注员相比仍有提升空间。此外，研究探讨了越南法律问答系统的进展，提出多种技术以提高低资源语言的问答性能，展示了法律领域问答系统的潜力。

R2GQA：支持学生理解高等教育法律法规的检索-阅读-生成问答系统

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型在虚假信息和法律领域的应用，提出了HiSS和FOLK等方法以提升声明验证的准确性和解释性。实验结果表明，这些方法优于传统模型，并强调了法律领域对大型语言模型的需求与挑战，提出了未来的研究方向。

大型语言模型时代的声明验证：一项综述

BriefGPT - AI 论文速递 ·

突破性的法律AI基准：LegalBench-RAG测试检索增强生成

DEV Community ·

本文探讨了人工智能在法律领域的应用，特别是自然语言处理技术在提取法律判决关键信息、构建案例知识图谱及提升案例检索效率方面的作用。研究表明，大型语言模型在捕捉法律语言细微差别上优于传统方法，促进了法律信息的可获取性和公正性。

Judgment2vec：利用图分析进行相似判决的搜索与推荐

BriefGPT - AI 论文速递 ·

近期研究表明，大型语言模型（LLMs）在法律领域的应用表现良好，尤其是在合同条款分类等任务中，尽管未经过专门训练。然而，其性能仍低于经过微调的小型法律模型，显示出对法律专业知识的需求。此外，LLMs在税法应用中的表现有限，强调了微调和领域知识的重要性。

法律特化的力量：Lawma

BriefGPT - AI 论文速递 ·

初为执业律师张静通过使用文心一言体验到了专业的帮助，发现其在法律领域的检索能力强，提供相关案例和法律文书，称其为“移动的法条”，服务效率提高，风险降低。推荐使用文心一言的「指令润色」功能，帮助写好指令词。尝试了文心大模型4.0 Turbo，效果惊艳，相信使用全新升级的模型后工作会更得心应手。

用上文心一言的律师，已经next level了！

百度大脑 ·

本文综述了大型语言模型（LLMs）的现状与挑战，探讨了其在网络安全、新闻标题识别和法律领域的应用。研究指出，LLMs在多语言支持和一致性方面存在差异，并提出LDFighter机制以减轻语言歧视。同时，强调了人本评估与伦理问题的重要性，未来需加强法律领域的LLMs开发。

Genshin: 大规模语言模型下的自然语言处理通用护盾

BriefGPT - AI 论文速递 ·

本文探讨了上下文在科学论文引用预测中的重要性，提出了一种基于双向LSTM的深度学习模型，并构建了新的数据集。研究表明，该模型在引用预测中提高了28%的准确率。此外，讨论了大型语言模型在引文生成中的潜力，以及领域特定模型在法律领域引用检测中的优势。

利用基于注意力的双向长短期记忆网络和可解释模型来建模引用值

BriefGPT - AI 论文速递 ·

近期，自然语言处理（NLP）在法律领域面临挑战，但大型语言模型（LLMs）提供了新机遇。研究比较了通用LLMs与领域特定模型在法律合同分类中的表现，发现通用模型性能较低，强调了需要更强大的法律领域LLMs。提出通过领域知识增强LLMs的方法，实验显示能显著提高模型在特定领域的表现。

BLADE：用小型领域专属模型增强黑盒大型语言模型

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在法律领域的应用及其面临的隐私和偏见挑战。研究比较了通用LLMs与领域特定模型在法律任务中的表现，指出通用模型在分类上存在不足，强调需要更强大的法律领域LLMs。同时，文章讨论了LLMs在生成文本中的伦理问题，呼吁对其进行深入研究和评估。

阅读注意：大型语言模型在法律实践中的应用

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在法律领域的应用及挑战，包括序列长度、专业词汇和数据不平衡。研究比较了通用LLMs与领域特定模型在法律任务中的表现，发现通用模型在分类上表现良好，但需微调以提高准确性。提出了新的评估基准LawBench，强调法律专业知识的重要性，并讨论了AI在法律咨询和案件审理中的应用及局限性。

SaulLM-7B：一款用于法律的创新大型语言模型

BriefGPT - AI 论文速递 ·

本文介绍了一种创新的掩码方法，利用流派和主题信息来定制语言模型以适用于专业领域。该方法通过对词语进行排名，优先选择重要性高的词进行掩码处理。实验证明该方法在法律领域的有效性，并提供免费使用的预训练语言模型和代码。

基于体裁和主题特征的选择性屏蔽在专业领域中对语言模型的适应

BriefGPT - AI 论文速递 ·

研究评估了两个大型语言模型与传统神经机器翻译系统在法律领域的机器翻译质量，结果显示语言模型略优。研究强调了语言模型在专业领域的进化能力，并呼吁重新评估评估方法以更好捕捉翻译的细微差别。

大型语言模型 “ad referendum”: 在法律领域的机器翻译水平如何？

BriefGPT - AI 论文速递 ·

本论文研究了可解释人工智能在文本领域的应用，并提出了SIDU-TXT方法。研究发现，SIDU-TXT在情感分析任务中表现更好，但在法律领域的庇护决策中需要进一步研究适用的XAI方法。

SIDU-TXT：一种用于 NLP 的 XAI 算法，采用完整评估方法

BriefGPT - AI 论文速递 ·

自然语言处理在法律领域面临挑战，如序列长度、专业词汇和数据不平衡。大型语言模型为法律领域提供新机会。研究比较了三个通用语言模型在合同条款分类测试集上的性能，发现它们在大多数情况下能正确分类主题，但比微调的小模型性能低。需要更强大的法律领域语言模型。

复杂文档分类：比较定制解决方案与大型语言模型

BriefGPT - AI 论文速递 ·

近期，法律领域中的自然语言处理（NLP）面临着序列长度、专业词汇和数据不平衡等挑战。研究比较了三个通用LLMs在合同条款分类测试集上的性能，发现它们在大多数情况下能正确分类主题，但性能比较小模型低19.2/26.8％，需要更强大的法律领域LLMs。

大型语言模型的合法性及局限性：构建强大的法律语言模型的论证

BriefGPT - AI 论文速递 ·