本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。经过训练和微调,该模型实现了92.11的F1分数,有效降低了三种语言之间的实体不一致性。
本研究提出了一种结合TF-IDF和BERT嵌入的加权集成方法,以提高马拉地语的抄袭检测准确性,能够有效捕捉文本的统计、语义和句法特征,具有良好的实际应用潜力。
本研究探讨了低资源语言(如马拉地语)在自然语言处理中的挑战,比较了上下文BERT、非上下文BERT和FastText的嵌入技术,结果显示上下文嵌入的性能最佳,为低资源语言处理提供了新思路。
用户在使用Flutter生成PDF时,遇到印地语/马拉地语字体“जिल्हा परिषद”输出不正确的问题。
完成下面两步后,将自动完成登录并继续当前操作。