ViANLI: 针对越南语的对抗自然语言推理

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

中国首个大规模NLI数据集由语言学专家注释,通过中文预训练模型测试,发现模型性能落后于人类。该数据集有望加速中文NLU的进展。

🎯

关键要点

  • 中国首个大规模NLI数据集由语言学专家注释。
  • 该数据集旨在解决全球大部分语言缺乏可靠NLI数据集的问题。
  • 通过中文预训练模型测试,发现模型性能落后于人类。
  • 这一数据集有望加速中文NLU的进展。
  • 这是首个非英语语言的人采集的MNLI风格数据集。
➡️

继续阅读