语音 - MASSIVE:一个面向 SLU 及更多领域的多语种语音数据集
原文中文,约400字,阅读约需1分钟。发表于: 。我们介绍了 Speech-MASSIVE,这是一个多语种口语理解(SLU)数据集,其中包括 MASSIVE 文本语料库的一部分语音对应部分。Speech-MASSIVE 涵盖了 12 种不同语系的语言,并且继承了 MASSIVE 关于意图预测和插槽填充任务的注释。我们提供了一个多模态、多任务、多语种的数据集,并使用级联和端到端架构在各种训练场景(零样本、少样本和全微调)下报告了 SLU...
介绍了Speech-MASSIVE多语种口语理解数据集,包括12种语言。数据集继承MASSIVE的意图预测和插槽填充任务注释。作者使用级联和端到端架构在不同训练场景下报告了SLU的基线结果,并展示了Speech-MASSIVE在其他任务方面的适用性。数据集、模型和代码公开可用。