小红花·文摘

使用BPE分词工具在土耳其语语料库上预训练RoBERTa模型，优于BERTurk模型在词性标注任务中，但在IMST数据集上表现不佳。在土库曼语的XTREME数据集上的命名实体识别任务中获得竞争性分数。公开了预训练模型和分词工具。