SpaDeLeF:西班牙语词搭结构的层次分类数据集
原文中文,约300字,阅读约需1分钟。发表于: 。在本文中,我们介绍了一个包含西班牙语最常见动宾短语及其出现句子的数据集,每个动宾短语都被分配到 37 个词汇功能中的一个类别,用于执行一个分层分类任务。我们将这些类别组合成一个基于树结构的体系,并为每个层级引入了分类目标。该数据集通过对西班牙新闻中的短语进行依赖树解析和匹配而创建,我们提供了每个目标的基准和数据拆分。
该文章介绍了一个包含西班牙语常见动宾短语及其出现句子的数据集,用于分层分类任务。数据集通过对西班牙新闻中的短语进行依赖树解析和匹配而创建,提供了每个目标的基准和数据拆分。每个动宾短语都被分配到37个词汇功能中的一个类别,并将这些类别组合成一个基于树结构的体系,并为每个层级引入了分类目标。