小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种多语言命名实体识别（NER）模型，专注于印地语、孟加拉语和马拉地语。经过训练和微调，该模型实现了92.11的F1分数，有效降低了三种语言之间的实体不一致性。

TriNER: A Series of Named Entity Recognition Models for Hindi, Bengali, and Marathi

BriefGPT - AI 论文速递 ·

本研究提出了一种结合TF-IDF和BERT嵌入的加权集成方法，以提高马拉地语的抄袭检测准确性，能够有效捕捉文本的统计、语义和句法特征，具有良好的实际应用潜力。

Enhancing Plagiarism Detection in Marathi with a Weighted Ensemble of TF-IDF and BERT Embeddings

BriefGPT - AI 论文速递 ·

本研究探讨了低资源语言（如马拉地语）在自然语言处理中的挑战，比较了上下文BERT、非上下文BERT和FastText的嵌入技术，结果显示上下文嵌入的性能最佳，为低资源语言处理提供了新思路。

BERT or FastText? A Comparative Analysis of Contextual and Non-Contextual Embeddings

BriefGPT - AI 论文速递 ·

用户在使用Flutter生成PDF时，遇到印地语/马拉地语字体“जिल्हा परिषद”输出不正确的问题。

您好，我遇到了一个问题：在PDF中使用印地语/马拉地语字体时，我的输入是'जिल्हा परिषद'，但在Flutter生成的PDF中输出却不同。

DEV Community ·