PerSHOP -- 波斯购物对话系统建模的数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

通过众包开发了一个波斯语对话数据集,包含22k个发言、15个领域和1061个对话。标注并训练了模型,提出了用于自然语言理解任务的基准模型,意图分类F-1得分约为91%,实体抽取F-1得分约为93%。可作为未来研究的基准。

🎯

关键要点

  • 通过众包开发了一个波斯语对话数据集,包含近22k个发言、15个领域和1061个对话。
  • 对数据集进行了标注以训练模型。
  • 提出了用于自然语言理解任务的基准模型。
  • 意图分类的F-1得分约为91%。
  • 实体抽取的F-1得分约为93%。
  • 该数据集和模型可作为未来研究的基准。
➡️

继续阅读