小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
法律文本AI突破:句子边界检测准确率达到98%

NUPunkt和CharBoundary算法在法律文本中以98%的准确率识别句子边界,超越了spaCy和NLTK等解决方案,专为复杂法律文档设计,处理速度可达每秒1000万字符,并已开源为Python包。

法律文本AI突破:句子边界检测准确率达到98%

DEV Community
DEV Community · 2025-04-12T06:48:59Z
开源许可获得 AI 升级

openSUSE社区发布了Cavil法律文本数据集,旨在提高法律文本分类的准确性并减少人工审核。该数据集包含150,000个标注样本,支持自动提取和分类法律文本,帮助法律专家专注于关键案件。Cavil由用户友好的网络应用、后台任务处理和AI分类服务器组成,采用字符级卷积神经网络模型。数据集可在Hugging Face免费获取,鼓励开源贡献。

开源许可获得 AI 升级

openSUSE 中文社区
openSUSE 中文社区 · 2025-02-13T23:00:00Z

本研究比较了德国公共服务行政中的法律文本命名实体识别(NER)方法,包括基于规则、深度判别和深度生成模型,结果显示深度判别模型在处理复杂语义和句法方面表现最佳。

GerPS-Compare:法律规范分析中的命名实体识别方法比较

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究提出了一种多层嵌入的法律文本检索方法,旨在提升法律信息检索的准确性和有效性,适用于多种法律体系。

多层嵌入式检索解锁法律知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z
微调GPT-4o

本文介绍了如何通过少量代码在旧笔记本上提升GPT-4o在法律文本分类中的表现。首先需优化提示语,若无效可尝试函数调用或RAG管道。最后,若需特定风格和准确性,可对GPT-4进行微调。教程包括数据集准备、API设置、模型微调及访问微调模型的步骤。

微调GPT-4o

KDnuggets
KDnuggets · 2024-10-29T12:00:08Z

Mistral 7B v0.1 是一个拥有70亿参数的语言模型,采用高效的分组查询注意力和滑动窗口注意力技术。Nemotron-4 15B 是150亿参数的多语言模型,表现优异。SaulLM-7B 专为法律领域设计,具备70亿参数,训练于300亿个法律文本。此外,研究还探讨了古希腊文献学中的模型应用,提升了文本理解和翻译能力。

Meltemi:希腊首个开放式大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-30T00:00:00Z

本论文探讨了针对印度法律文本的自然语言处理技术,提出了利用Legal-BERT-HSLN和Legal-LUKE模型进行法律文本分析的方法。研究构建了高质量的法律平行语料库,并评估了多种机器翻译系统的性能,强调了大型语言模型在法律领域的应用潜力及挑战。

IL-TUR:印度法律文本理解与推理基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-07T00:00:00Z

本文评估了18种检测注释错误的方法,分析了法律文本中命名实体识别(NER)性能下降的问题,并探讨了文本歧义对注释质量的影响。研究展示了部分标记数据和预训练模型在多语言NER中的应用,并提出了改进评估方法和模型性能的建议。

注释错误与 NER:OntoNotes 5.0 研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文介绍了针对美国民事诉讼的新自然语言处理任务及数据集,研究了法律语言模型的微调效果。通过无监督方法和多种模型结合,提升了法律文本处理性能。实验结果表明,领域知识训练的模型在法律答案验证中表现优异,但大型语言模型在法律领域的应用仍需改进。

SemEval2024 任务 5:民事诉讼中的合法论证任务中的渴望学习耠

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文介绍了EASSE Python包,旨在标准化句子简化系统的评估。研究通过微调语言模型和构建德语语料库,解决数据稀缺问题,提升文本简化性能。同时,项目关注法律文本的可理解性,并探索生成图像的AI应用。研究结果强调了针对特定受众的文本格式框架的重要性。

EASSE-DE:德文自动句子简化评估的更简易方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

该论文提出了一种新的法律文本语义检索方法,并评估了多种解决方案。针对文本片段的相关性检测,提出了改进策略,并展示了专门化法律领域语言模型的成果。

DISL: 以大规模 Solidity 智能合约数据集推动研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

Gyan AI Paramanu 是一款针对印度语言的语言模型,支持10种语言和5种脚本,性能优于其他模型。研究提出了利用 Legal-BERT-HSLN 和 Legal-LUKE 模型分析法律文本的方法,显著提高了法律案件的处理效率,并探讨了多语言模型在法律领域的应用及优化,旨在提升法律专业人员的工作效率。

PARAMANU-AYN: 适用于印度法律案件文件的高效新型生成和指导语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-20T00:00:00Z

本研究探讨了处理长篇法律文本的两种方法:改进的 Longformer 和 TF-IDF 表示。结果表明,改进的 Longformer 在 LexGLUE 中表现最佳,且计算效率更高。研究还提出了通过短输入和递归方法提高模型效率的策略,显著加速训练并减少内存使用。此外,探讨了 Transformer 模型在低资源语言翻译中的应用及超参数调整的重要性。

对付时间与内存受限 GPU 服务下的长文本分类的简单转换器技巧

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

该研究探讨了将NLP可解释性应用于法律文本的方法,提出了基于段落的理由提取方法,并引入了新的数据集。该任务具有挑战性,需要深入研究。

VECHR:欧洲人权法院漏洞类型可解释及稳定分类数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码