TriNER: A Series of Named Entity Recognition Models for Hindi, Bengali, and Marathi
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。经过训练和微调,该模型实现了92.11的F1分数,有效降低了三种语言之间的实体不一致性。
🎯
关键要点
-
本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。
-
该模型通过训练定制的变换器模型和微调预训练模型,达到了92.11的F1分数。
-
研究显著降低了三种语言之间实体组和标签名称的不一致性。
-
印度的文化和语言多样性对自然语言处理(NLP)领域,尤其是命名实体识别(NER)带来了挑战。
➡️