Sigma:一个用于文本到代码语义解析及统计分析的数据集
📝
内容提要
本研究解决了文本到SQL和问答任务中,现有语义表示形式限制的数据分析能力的不足,提出了SIGMA数据集,涵盖了6000个与160个数据库相关的问题及其相应的Python代码标签。实验结果表明,结合ELECTRA的LGESQL模型在结构准确率上达到了83.37%,展现了该数据集在促进文本到代码语义解析和统计分析研究方面的潜在影响。
➡️