Oozie是一个基于工作流引擎的开源框架,它能够提供对Hadoop作业的任务调度与协调。Oozie是一个工作流引擎服务器,用于运行MapReduce任务工作流。同时Oozie还是一个Java Web程序,运行在Tomcat容器中。
本文介绍如何在Apache Hadoop的Hue系统中创建包含Spark动作的Oozie PySpark工作流。使用PySpark库设置Spark会话并配置运行模式,确保使用正确的Spark库和JAR包路径。
本文将以springboot调用Oozie的API实现workflow和coordinator等任务的提交停止 前提:关于h
完成下面两步后,将自动完成登录并继续当前操作。