TriNER: A Series of Named Entity Recognition Models for Hindi, Bengali, and Marathi

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。经过训练和微调,该模型实现了92.11的F1分数,有效降低了三种语言之间的实体不一致性。

🎯

关键要点

  • 本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。

  • 该模型通过训练定制的变换器模型和微调预训练模型,达到了92.11的F1分数。

  • 研究显著降低了三种语言之间实体组和标签名称的不一致性。

  • 印度的文化和语言多样性对自然语言处理(NLP)领域,尤其是命名实体识别(NER)带来了挑战。

➡️

继续阅读