克莱尔法语对话数据集
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一个新的跨方言语音数据集,用于英语印度、尼日利亚和美国口音。该数据集包括超过20个小时的音频和超过200,000个正字法转录的标记,并已公开发布。
🎯
关键要点
- 介绍了一个新的跨方言语音数据集,涵盖英语印度、尼日利亚和美国口音。
- 数据集通过提示参与者执行信息分享任务,平衡开放式对话和面向任务的对话。
- 旨在促进量化的跨方言比较,避免限制性任务结构的强制性。
- 初步分析显示该数据集在语法和话语标记的使用上存在显著差异。
- 数据集包含超过20小时的音频和超过200,000个正字法转录的标记,并已公开发布。
➡️