FreeBuf网络安全行业门户 ·

Text2SQL准确率暴涨22.6%！3大维度全拆

💡 原文中文，约5300字，阅读约需13分钟。

📝

内容提要

Text2SQL任务将自然语言查询转为SQL，经历四个阶段，目前面临提示优化、模型训练和推理增强三大难题。本文提出J-Schema和Iterative DPO方法，使模型在BIRD数据集上的执行准确率从56.6%提升至69.2%。通过思维链引导推理，采用自洽性方法优化答案选择，取得显著效果。

🎯

🔎

Text2SQL技术经历了多个阶段，从基于规则到大语言模型，每个阶段都有其独特的挑战。当前的主要难题包括提示优化、模型训练和推理增强。理解这些挑战有助于研究人员在开发新模型时更有针对性地解决问题。

J-Schema通过结构化的方式呈现数据库信息，显著提升了模型对数据库结构的理解。这种方法不仅提高了执行准确率，也为未来的数据库设计提供了新的思路，尤其是在处理复杂查询时。

自洽性方法通过生成多个候选答案并进行投票选择，能够提高模型的输出可靠性。软投票相较于硬投票在处理近似正确结果时表现更佳，这一策略在实际应用中值得关注，尤其是在需要高准确率的场景中。

❓

Text2SQL任务的主要目标是将自然语言查询转换为可在关系数据库上执行的SQL查询。

J-Schema通过结构化格式呈现数据库结构，帮助模型更好地理解数据库，从而提升执行准确率。

Iterative DPO训练方法通过多轮迭代提升模型性能，能够更好地对齐人类需求，显著提高模型的基础能力。

思维链引导推理的核心是引导模型在输出最终答案前，先生成连贯的中间推理步骤，模拟人类逐步思考的过程。

自洽性方法通过让模型对同一问题生成多个候选答案，并通过投票机制选择最优解，从而提高答案的可靠性。

未来研究的重点方向包括数据构造、其他训练方法的探索以及增加测试数据集以提升模型的鲁棒性。

🏷️