本论文介绍了名为UNITE的文本到SQL评估基准,包含12个以上领域的自然语言问题、3.9K多个SQL模式的查询和29K个数据库。比较了六种最新的SOTA文本到SQL解析器在该基准上的表现,发现这些模型在组合泛化和鲁棒性问题上仍存在困难。
该研究使用基于关系感知自注意机制的统一框架,在 Spider 数据集上实现了 65.6%的性能,成为了新的最佳表现。
本文介绍了一个使用多索引 Pandas 数据帧作为表格统一表示的 TableQA 框架,使用 Python 作为查询语言,能够将自然语言问题转化为可在 Pandas 数据帧上执行的 Python 程序。该框架允许自定义 API,具备扩展程序功能和外部知识。在四个 TableQA 数据集上进行了实验,取得了显著的改进。
完成下面两步后,将自动完成登录并继续当前操作。