SpaDeLeF:西班牙语词搭结构的层次分类数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文章介绍了一个包含西班牙语常见动宾短语及其出现句子的数据集,用于分层分类任务。数据集通过对西班牙新闻中的短语进行依赖树解析和匹配而创建,提供了每个目标的基准和数据拆分。每个动宾短语都被分配到37个词汇功能中的一个类别,并将这些类别组合成一个基于树结构的体系,并为每个层级引入了分类目标。

🎯

关键要点

  • 文章介绍了一个包含西班牙语常见动宾短语及其出现句子的数据集。
  • 数据集用于执行分层分类任务。
  • 每个动宾短语被分配到37个词汇功能中的一个类别。
  • 这些类别组合成一个基于树结构的体系。
  • 为每个层级引入了分类目标。
  • 数据集通过对西班牙新闻中的短语进行依赖树解析和匹配而创建。
  • 提供了每个目标的基准和数据拆分。
➡️

继续阅读