TiDB 扩容过程中 PD 生成调度的原理及常见问题丨TiDB 扩缩容指南(一)

💡 原文中文,约12900字,阅读约需31分钟。
📝

内容提要

本文介绍了TiDB集群的扩缩容操作原理、配置和常见问题,包括资源均衡调度指令的产生和执行速度,添加learner节点、切换角色和删除旧节点的具体步骤,扩容速度的监控和调优方法,调度生成原理和常见问题,以及判断扩容瓶颈在TiKV还是PD的方法。

🎯

关键要点

  • TiDB集群的扩缩容是常见的运维操作,主要关注资源均衡调度指令的产生和执行速度。
  • 扩缩容过程分为调度生成原理、调度执行和常见问题。
  • 扩容时,当TiKV资源使用达到75%时,需要添加节点以提高性能。
  • 扩容过程中的关键步骤包括添加learner节点、角色切换和删除旧节点。
  • PD通过心跳机制生成调度指令,确保新节点的资源被有效利用。
  • 扩容速度受PD生成调度指令的速度和TiKV数据搬迁速度的影响。
  • 监控扩容状态的指标包括Pending-region-count、Learner-peer-count和当前扩容速度。
  • balance-region-scheduler负责将Region均匀分散在集群中,确保资源平衡。
  • 常见问题包括调度器被关闭、region-schedule-limit限制和store limit配置问题。
  • 通过监控PD日志和配置项,可以判断扩容过程中的瓶颈所在。
➡️

继续阅读