泰语指代消解数据集:Thai Coref

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究使用一个包含31种南亚语言的多语种共指解析翻译数据集训练了两个模型。最佳模型在印地语黄金集上的得分分别为64和68,并指出了当前共指评估指标的局限性,呼吁开发更合适的评估指标。

🎯

关键要点

  • 研究使用了一个包含31种南亚语言的多语种共指解析翻译数据集。
  • 两个共指解析模型使用该数据集与手工注释的印地语数据集进行训练。
  • 最佳模型在印地语黄金集上的LEA F1得分为64,CoNLL F1得分为68。
  • 研究首次在印地语黄金集上评估了端到端共指解析模型。
  • 强调了当前共指评估指标在拆分先行词数据集上的局限性。
  • 呼吁开发更合适的共指评估指标。
➡️

继续阅读