基于多标签的吉尔吉斯语主题分类评估

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一个新的公共基准,用于针对柯尔克孜语进行主题分类。作者使用来自24.KG新闻网站的数据集进行训练和评估,并提出了多标记设置下的几个基准模型。文章讨论了结果和未来工作的方向。

🎯

关键要点

  • 提出了一个针对柯尔克孜语的主题分类新公共基准。
  • 使用来自24.KG新闻网站的数据集进行训练和评估。
  • 提出了多标记设置下的几个基准模型。
  • 训练和评估了经典统计模型和神经模型。
  • 报告了模型的分数,讨论了结果。
  • 提出了未来工作的方向。
➡️

继续阅读