语音 - MASSIVE:一个面向 SLU 及更多领域的多语种语音数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
介绍了Speech-MASSIVE多语种口语理解数据集,包括12种语言。数据集继承MASSIVE的意图预测和插槽填充任务注释。作者使用级联和端到端架构在不同训练场景下报告了SLU的基线结果,并展示了Speech-MASSIVE在其他任务方面的适用性。数据集、模型和代码公开可用。
🎯
关键要点
- 介绍了Speech-MASSIVE多语种口语理解数据集,涵盖12种语言。
- 数据集继承了MASSIVE的意图预测和插槽填充任务注释。
- 提供了多模态、多任务、多语种的数据集。
- 使用级联和端到端架构在不同训练场景下报告SLU的基线结果。
- 展示了Speech-MASSIVE在语音转录、语言识别和语音翻译等其他任务的适用性。
- 数据集、模型和代码均已公开可用。
🏷️
标签
➡️