Kedro是一个开源工具,旨在帮助数据科学项目从实验笔记本转向生产环境。文章介绍了Kedro的安装、项目创建及核心功能,包括数据目录和数据处理管道的构建。用户可以定义数据集,创建特征工程和数据分割的节点,并通过配置文件管理参数。运行项目后,用户可以查看数据处理结果,并使用Kedro可视化工具展示工作流程。
Kedro 是一个用于生产级数据科学的工具箱,支持可维护和模块化的数据工程及科学流水线。它提供项目模板、数据目录、流水线抽象、编码规范和灵活的部署选项,帮助数据科学家实现高效工作流。
完成下面两步后,将自动完成登录并继续当前操作。