语音 - MASSIVE:一个面向 SLU 及更多领域的多语种语音数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

介绍了Speech-MASSIVE多语种口语理解数据集,包括12种语言。数据集继承MASSIVE的意图预测和插槽填充任务注释。作者使用级联和端到端架构在不同训练场景下报告了SLU的基线结果,并展示了Speech-MASSIVE在其他任务方面的适用性。数据集、模型和代码公开可用。

🎯

关键要点

  • 介绍了Speech-MASSIVE多语种口语理解数据集,涵盖12种语言。
  • 数据集继承了MASSIVE的意图预测和插槽填充任务注释。
  • 提供了多模态、多任务、多语种的数据集。
  • 使用级联和端到端架构在不同训练场景下报告SLU的基线结果。
  • 展示了Speech-MASSIVE在语音转录、语言识别和语音翻译等其他任务的适用性。
  • 数据集、模型和代码均已公开可用。
➡️

继续阅读