TiDB 扩容过程中 PD 生成调度的原理及常见问题丨TiDB 扩缩容指南(一)
💡
原文中文,约12900字,阅读约需31分钟。
📝
内容提要
本文介绍了TiDB集群的扩缩容操作原理、配置和常见问题,包括资源均衡调度指令的产生和执行速度,添加learner节点、切换角色和删除旧节点的具体步骤,扩容速度的监控和调优方法,调度生成原理和常见问题,以及判断扩容瓶颈在TiKV还是PD的方法。
🎯
关键要点
- TiDB集群的扩缩容是常见的运维操作,主要关注资源均衡调度指令的产生和执行速度。
- 扩缩容过程分为调度生成原理、调度执行和常见问题。
- 扩容时,当TiKV资源使用达到75%时,需要添加节点以提高性能。
- 扩容过程中的关键步骤包括添加learner节点、角色切换和删除旧节点。
- PD通过心跳机制生成调度指令,确保新节点的资源被有效利用。
- 扩容速度受PD生成调度指令的速度和TiKV数据搬迁速度的影响。
- 监控扩容状态的指标包括Pending-region-count、Learner-peer-count和当前扩容速度。
- balance-region-scheduler负责将Region均匀分散在集群中,确保资源平衡。
- 常见问题包括调度器被关闭、region-schedule-limit限制和store limit配置问题。
- 通过监控PD日志和配置项,可以判断扩容过程中的瓶颈所在。
❓
延伸问答
TiDB 扩容时如何判断是否需要添加节点?
当 TiKV 资源使用达到 75% 时,通常需要添加节点以提高性能。
PD 在扩容过程中如何生成调度指令?
PD 通过心跳机制生成调度指令,确保新节点的资源被有效利用。
扩容过程中有哪些关键步骤?
关键步骤包括添加 learner 节点、角色切换和删除旧节点。
如何监控 TiDB 扩容的状态?
可以通过监控指标如 Pending-region-count、Learner-peer-count 和当前扩容速度来监控状态。
扩容速度受哪些因素影响?
扩容速度受 PD 生成调度指令的速度和 TiKV 数据搬迁速度的影响。
常见的扩容问题有哪些?
常见问题包括调度器被关闭、region-schedule-limit 限制和 store limit 配置问题。
➡️