可组合数据系统之路:对过去15年和未来的思考
原文中文,约4300字,阅读约需11分钟。发表于: 。来自韦斯·麦金尼文章: 15年前,也就是2008年4月,我开始构建数据分析工具。我当时所感知到的是数据科学的迫切“Python化”。这不仅是为了让新一代的数据从业者更容易获得数据科学,也是为了让现有的数据科学家更有效率。 到2013年,Pandas已经足够成功,我将其开发交给其他核心开发人员,我的书《 Python for Data Analysis...
韦斯·麦金尼回顾了数据科学工具的发展,提到了Apache Arrow、Ibis、RAPIDS、DuckDB和Velox等项目,讨论了数据交换、查询处理和编程接口的模块化,以及硬件加速和数据分析的中间表示的重要性。他预测未来几年将有更多投资在用户界面生产力方面。