乌兹别克语中的设计模式与语言处理技术研究 - 小红花·文摘 - 小红花技术领袖俱乐部

本研究针对乌兹别克语这一低资源语言的自然语言处理，评估了两种之前未测试的单语乌兹别克BERT模型在词性标注任务上的表现，并引入了首个公开可用的乌兹别克语UPOS标注基准数据集。经微调的模型平均准确率达到91%，超越了基线的多语言BERT和基于规则的标注器，显示出相比现有规则标注器更强的上下文敏感性和词缀处理能力。

BBPOS：基于BERT的乌兹别克语词性标注

BriefGPT - AI 论文速递 ·

责任链模式在乌兹别克语中的应用

责任链模式在乌兹别克语中的应用

DEV Community ·

命令设计模式 🥷 乌兹别克语

命令设计模式 🥷 乌兹别克语

DEV Community ·

迭代器设计模式在乌兹别克语中的应用

迭代器设计模式在乌兹别克语中的应用

DEV Community ·

本文介绍了一种基于规则的乌兹别克语词干提取算法，利用有限状态机剥离词缀，并建立词缀词典。研究还提出了乌兹别克语词性标注工具，解决低资源语言样本不足的问题，展示了音节化的综合方法，准确率超过99%。该研究为乌兹别克语及相关语言的未来研究提供了重要见解。

UzMorphAnalyser: 用词尾进行乌兹别克语言的形态分析模型

BriefGPT - AI 论文速递 ·