蚂蚁数科宣布开源数据分析智能体技术,当前登顶BIRD
💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
12月13日,蚂蚁数科在CCF中国数据大会上开源了Agentar SQL技术,允许非专业人员使用自然语言进行数据查询。该技术在试运营中查询准确率超过92%,并在BIRD-SQL评测中表现优异。未来将开源更多数据智能技术,推动商业智能市场发展。
🎯
关键要点
- 蚂蚁数科在CCF中国数据大会上开源了Agentar SQL技术,允许非专业人员使用自然语言进行数据查询。
- Agentar SQL技术在试运营中查询准确率超过92%,并在BIRD-SQL评测中表现优异。
- 蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,提升文本与数据库查询交互效率。
- 到2026年,蚂蚁数科将开源更多数据智能技术,覆盖意图理解、业务理解到数据理解的全链路数据能力。
- BIRD-SQL是全球最难的NL2SQL测试,要求AI模型在真实复杂的大规模生产级数据库中稳定执行。
- 研究机构预测,全球商业智能市场规模到2025年将达474.8亿,中国市场规模将达12亿。
- 中国商业智能软件市场预计到2028年将达到17.9亿美元,年复合增长率为12.7%。
- NL2SQL在产业中规模化落地面临理解模糊口语、注入行业知识、解析复杂数据库结构等挑战。
- 章鹏指出,简单模型无法满足企业级应用的可靠性与准确性要求。
- 蚂蚁数科计划逐步开源更全面的能力模块,如Agentar Profiling-SQL和Agentar TuningFree-SQL。
- 首期在线扩展框架Agentar-Scale-SQL的开源内容已在多个平台发布,获得开发者关注。
➡️