TiDB 扩容过程中 PD 生成调度的原理及常见问题丨TiDB 扩缩容指南(一)

💡 原文中文,约12900字,阅读约需31分钟。
📝

内容提要

本文介绍了TiDB集群的扩缩容操作原理、配置和常见问题,包括资源均衡调度指令的产生和执行速度,添加learner节点、切换角色和删除旧节点的具体步骤,扩容速度的监控和调优方法,调度生成原理和常见问题,以及判断扩容瓶颈在TiKV还是PD的方法。

🎯

关键要点

  • TiDB集群的扩缩容是常见的运维操作,主要关注资源均衡调度指令的产生和执行速度。
  • 扩缩容过程分为调度生成原理、调度执行和常见问题。
  • 扩容时,当TiKV资源使用达到75%时,需要添加节点以提高性能。
  • 扩容过程中的关键步骤包括添加learner节点、角色切换和删除旧节点。
  • PD通过心跳机制生成调度指令,确保新节点的资源被有效利用。
  • 扩容速度受PD生成调度指令的速度和TiKV数据搬迁速度的影响。
  • 监控扩容状态的指标包括Pending-region-count、Learner-peer-count和当前扩容速度。
  • balance-region-scheduler负责将Region均匀分散在集群中,确保资源平衡。
  • 常见问题包括调度器被关闭、region-schedule-limit限制和store limit配置问题。
  • 通过监控PD日志和配置项,可以判断扩容过程中的瓶颈所在。

延伸问答

TiDB 扩容时如何判断是否需要添加节点?

当 TiKV 资源使用达到 75% 时,通常需要添加节点以提高性能。

PD 在扩容过程中如何生成调度指令?

PD 通过心跳机制生成调度指令,确保新节点的资源被有效利用。

扩容过程中有哪些关键步骤?

关键步骤包括添加 learner 节点、角色切换和删除旧节点。

如何监控 TiDB 扩容的状态?

可以通过监控指标如 Pending-region-count、Learner-peer-count 和当前扩容速度来监控状态。

扩容速度受哪些因素影响?

扩容速度受 PD 生成调度指令的速度和 TiKV 数据搬迁速度的影响。

常见的扩容问题有哪些?

常见问题包括调度器被关闭、region-schedule-limit 限制和 store limit 配置问题。

➡️

继续阅读