蚂蚁数科宣布开源数据分析智能体技术,当前登顶BIRD

💡 原文中文,约1600字,阅读约需4分钟。
📝

内容提要

12月13日,蚂蚁数科在CCF中国数据大会上开源了Agentar SQL技术,允许非专业人员使用自然语言进行数据查询。该技术在试运营中查询准确率超过92%,并在BIRD-SQL评测中表现优异。未来将开源更多数据智能技术,推动商业智能市场发展。

🎯

关键要点

  • 蚂蚁数科在CCF中国数据大会上开源了Agentar SQL技术,允许非专业人员使用自然语言进行数据查询。
  • Agentar SQL技术在试运营中查询准确率超过92%,并在BIRD-SQL评测中表现优异。
  • 蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,提升文本与数据库查询交互效率。
  • 到2026年,蚂蚁数科将开源更多数据智能技术,覆盖意图理解、业务理解到数据理解的全链路数据能力。
  • BIRD-SQL是全球最难的NL2SQL测试,要求AI模型在真实复杂的大规模生产级数据库中稳定执行。
  • 研究机构预测,全球商业智能市场规模到2025年将达474.8亿,中国市场规模将达12亿。
  • 中国商业智能软件市场预计到2028年将达到17.9亿美元,年复合增长率为12.7%。
  • NL2SQL在产业中规模化落地面临理解模糊口语、注入行业知识、解析复杂数据库结构等挑战。
  • 章鹏指出,简单模型无法满足企业级应用的可靠性与准确性要求。
  • 蚂蚁数科计划逐步开源更全面的能力模块,如Agentar Profiling-SQL和Agentar TuningFree-SQL。
  • 首期在线扩展框架Agentar-Scale-SQL的开源内容已在多个平台发布,获得开发者关注。
➡️

继续阅读