Dialect2SQL: A Novel Text-to-SQL Dataset for Arabic Dialects with a Focus on Moroccan Darija
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出Dialect2SQL,这是首个针对阿拉伯方言的文本到SQL数据集,包含9,428个自然语言问题与SQL查询对,重点关注摩洛哥达里贾。该数据集将推动文本到SQL研究及低资源语言的开发。
🎯
关键要点
- Dialect2SQL是首个针对阿拉伯方言的文本到SQL数据集。
- 该数据集包含9,428个自然语言问题与SQL查询对。
- 重点关注摩洛哥达里贾的复杂性。
- Dialect2SQL的推出将推动文本到SQL研究及低资源语言的开发。
➡️