Dialect2SQL: A Novel Text-to-SQL Dataset for Arabic Dialects with a Focus on Moroccan Darija

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出Dialect2SQL,这是首个针对阿拉伯方言的文本到SQL数据集,包含9,428个自然语言问题与SQL查询对,重点关注摩洛哥达里贾。该数据集将推动文本到SQL研究及低资源语言的开发。

🎯

关键要点

  • Dialect2SQL是首个针对阿拉伯方言的文本到SQL数据集。
  • 该数据集包含9,428个自然语言问题与SQL查询对。
  • 重点关注摩洛哥达里贾的复杂性。
  • Dialect2SQL的推出将推动文本到SQL研究及低资源语言的开发。
➡️

继续阅读