小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究针对中库尔德语在自然语言处理中的资源不足问题,提出了一种全面的词性标注集,以提升相关任务的表现。该标注集通过整合研究和专家贡献,支持大规模语料库的标注,显著提高了库尔德语处理任务的准确性。

A Comprehensive Part-of-Speech Tagging Standardization for Central Kurdish: A Research Guide for Kurdish Natural Language Processing Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究比较了1900至1950年间中文文献中大型语言模型(LLMs)与传统自然语言处理工具在词语分割、词性标注和命名实体识别方面的表现。结果表明,LLMs在精度上优于传统方法,但计算成本较高,反映了精度与效率之间的权衡。

1900-1950年历史中文资料中的词语分割、词性标注和命名实体识别的比较分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z

本研究探讨了多语言模型重标定对表现不佳语言的影响,提出AlignFreeze方法,通过冻结模型层的上半部分或下半部分,避免性能下降。研究表明,冻结下层能有效改善某些语言的词性标注效果。

AlignFreeze: Navigating the Impact of Layer Realignment in Multilingual Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本文介绍了多种词性标注方法,包括基于后缀和字形信息的快速适应标注器、bi-LSTM模型以及联合词性标注与依存分析。这些方法在不同语言和领域中表现出色,特别是在处理未分割文本和濒危语言时,结合半监督和跨语言迁移技术取得了显著提升。

利用词性标注突出句子的骨架结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

研究探讨了新加坡英语词性标注的挑战,通过建立平行数据集和设计特定标注方法,提高标注准确度,揭示方言多样性和上下文依赖性对标注的影响。

新加坡英语标注中的挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究探讨了领域适应技术在历史文本处理中的应用,特别是在词性标注和文本规范化方面。通过深度学习模型和多任务学习,提升了模型性能。研究分析了不同语言的历史拼写规范化方法,强调了训练数据的重要性,并提出在规范化过程中需谨慎,以保留文本特性。

历史德语文本规范化:基于类型和标记的语言建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

该研究探讨了历史文本处理中的领域适应技术,重点关注词性标注和命名实体识别。通过比较不同模型和方法,评估了历史文本规范化的有效性,并提出了新的信息提取数据库和NER语料库,以提高OCR质量和数据结构识别的准确性。

文本规范化对中世纪文书分类的相关性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z
读《通向AGI之路:大型语言模型(LLM)技术精要》笔记整理

中间任务包括中文分词、词性标注、NER、句法分析、指代消解、语义Parser等,一般作为解决实际需求任务的中间或辅助阶段。最终任务包括文本分类、文本相似性计算、机器翻译、文本摘要等,能直接呈现给用户。

读《通向AGI之路:大型语言模型(LLM)技术精要》笔记整理

Anjhon’s Blog
Anjhon’s Blog · 2024-01-29T00:00:00Z

本文提出了一种生成模型,通过结构化的正则先验利用标记源数据和未标记目标数据联合学习源模型和目标模型的参数来解决跨语言迁移的问题。该方法在10种语言中相较于使用最先进的判别模型的直接转移方法,在词性标注和依赖分析方面分别获得了平均5.2%和8.3%的绝对改善。

爪哇语依存分析的跨语言迁移学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z
一款大大简化Python自然语言处理的开源库

TextBlob是一个Python库,用于自然语言处理任务,包括文本分析、情感分析和词性标注等。它使用NLTK和Pattern库构建,提供简单易用的API。除了提取关键词、分割句子、统计词频等基本功能外,还可以分析文本的情感倾向和词性。此外,TextBlob还提供了名词短语提取、拼写检查和语言翻译等功能。

一款大大简化Python自然语言处理的开源库

迷途小书童
迷途小书童 · 2023-09-30T15:12:53Z

本文研究了多任务学习在Fon语言的自然语言处理中的应用,重点关注了命名实体识别和词性标注任务,并展示了相对于其他预训练的多语种语言模型来说,具备竞争力或更好性能。

FonMTL: 面向 Fon 语的多任务学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码