TiDB 组件 GC 原理及常见问题
💡
原文中文,约13200字,阅读约需32分钟。
📝
内容提要
本文介绍了TiDB的垃圾回收(GC)机制及其实现原理和常见问题排查方法,包括计算GC safepoint、解析锁、连续范围数据删除和同步GC safepoint至集群其他组件。文章还讲述了定位GC leader、监控GC状态以及处理GC过程中的常见问题。
🎯
关键要点
-
TiDB 的垃圾回收(GC)机制旨在清理旧数据,减少对性能的影响,主要包括计算 GC safepoint、解析锁、连续范围数据删除和同步 GC safepoint。
-
TiDB 使用 RocksDB 存储引擎,通过 MVCC 机制实现分布式存储引擎 TiKV,以支持高可用分布式事务。
-
GC leader 是负责推动集群 GC 工作的角色,TiDB 中同一时刻只有一个 GC leader。
-
GC 流程主要分为四个步骤:计算 GC safepoint、清理锁、删除连续范围数据和同步 GC safepoint。
-
计算 GC safepoint 时需要考虑 GC lifetime 和未提交事务的状态,以确保数据安全性。
-
Resolve locks 步骤用于清理 GC safepoint 之前的锁,以避免数据一致性问题。
-
Delete Ranges 步骤针对连续范围的数据进行物理删除,以优化性能。
-
最后一步是将 GC safepoint 同步到 PD,以通知 TiKV 开始 GC 工作。
-
监控 GC 状态可以通过 Grafana 观察 GC worker actions 和 GC safepoint 的推进情况。
-
常见问题包括 GC 卡住、未提交事务影响 GC 进程等,需要通过日志进行排查。
➡️