Apache Doris 基于 Job Scheduler 实现秒级触发任务调度能力

💡 原文中文,约5800字,阅读约需14分钟。
📝

内容提要

Apache Doris 2.1版本引入了Job Scheduler功能,提高了数据管理中的定时调度能力。该功能包括高效调度、灵活调度、事件池和高性能处理队列等特点,实现了数据导入的完整性和一致性。同时,基于Catalog和Job Scheduler的数据自动同步也得到了介绍。未来,Doris Job Scheduler还将支持UI界面查看任务分布情况和对导入任务、UPDATE、DELETE操作进行定时调度。

🎯

关键要点

  • Apache Doris 2.1版本引入Job Scheduler功能,提高数据管理中的定时调度能力。
  • Job Scheduler支持高效调度、灵活调度、事件池和高性能处理队列,确保数据导入的完整性和一致性。
  • 定时调度在数据管理中重要,应用于定期数据更新、外部数据源同步和清理过期数据。
  • 之前版本依赖外部调度系统,存在灵活性不足和故障风险。
  • Job Scheduler实现自主任务调度,精准度达到秒级,降低对外部系统的依赖。
  • Job Scheduler具备高效调度、灵活调度、事件池和高可用等特点。
  • Job语法包括作业名称、调度类型、触发时间和执行操作。
  • 示例展示如何创建一次性和周期性Job。
  • Job Scheduler与Catalog结合,实现数据自动同步,支持跨数据源定期同步。
  • 设计与实现部分介绍了TimingWheel算法与Disruptor结合的高效调度机制。
  • 未来Doris Job Scheduler将支持UI界面查看任务分布、JOB流程编排和对导入任务的定时调度。
➡️

继续阅读