应用基于制图的新课程学习方法于 RoNLI:首个罗马尼亚自然语言推理语料库

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文章介绍了罗马尼亚语NLI语料库(RoNLI),包含58K个训练句子对和6K个验证和测试句子对。作者进行了多个机器学习方法的实验,并提供了基准模型的代码和数据集。

🎯

关键要点

  • 自然语言推理 (NLI) 是一个活跃研究的领域。
  • 本文提出了第一个罗马尼亚语 NLI 语料库(RoNLI)。
  • RoNLI 包含 58K 个通过远程监督获取的训练句子对。
  • RoNLI 还包括手动注释的 6K 个验证和测试句子对。
  • 进行了多个机器学习方法的实验,包括基于词嵌入的浅层模型和基于 Transformer 的神经网络。
  • 采用基于数据制图的新的课程学习策略改进了最佳模型。
  • 提供了数据集和用于重现基准模型的代码。
➡️

继续阅读