土法炼钢兴趣小组的博客 ·

B-tree 深度解剖：从磁盘 I/O 模型到 boltdb 源码

💡 原文中文，约22800字，阅读约需55分钟。

📝

内容提要

自1972年提出以来，B-tree成为数据库和文件系统的核心数据结构，因其与磁盘I/O模型的契合而减少随机读次数，查找效率高，适合大规模数据。B+tree是其变体，优化了范围查询和并发控制。节点分裂与合并是保持平衡的关键操作。现代存储引擎如InnoDB和PostgreSQL基于B-tree，适应硬件演进，继续发挥重要作用。

🎯

关键要点

B-tree自1972年提出以来，成为数据库和文件系统的核心数据结构，因其与磁盘I/O模型的契合而减少随机读次数，查找效率高。
B+tree是B-tree的变体，优化了范围查询和并发控制，所有数据存储在叶子节点，内部节点仅存储键和指针。
节点分裂与合并是保持B-tree平衡的关键操作，分裂时将中位数键上提到父节点，合并时从兄弟节点借键或合并。
批量加载可以提高B-tree的构建效率，逐条插入效率低，批量加载的I/O次数显著减少。
写放大是指为了写入1字节有效数据，实际需要写入磁盘的字节数，B+tree的写放大影响SSD的寿命。
现代存储引擎如InnoDB和PostgreSQL基于B-tree，适应硬件演进，继续发挥重要作用。

🔎

延伸解读

B-tree 的优势与应用场景

B-tree 由于其高效的查找性能和对磁盘 I/O 模型的良好适应性，广泛应用于数据库和文件系统中。尤其在处理大规模数据时，B-tree 的查找效率显著优于其他数据结构，如红黑树。这使得 B-tree 成为 OLTP 系统的首选索引结构，适合需要频繁读写的场景。

B+tree 的优化特性

B+tree 作为 B-tree 的变体，专注于优化范围查询和并发控制。所有数据存储在叶子节点，内部节点仅存储键和指针，这种设计提高了扇出，降低了树的高度，从而减少了 I/O 次数。此外，叶子节点之间的双向链表连接使得范围查询更加高效，适合需要顺序访问的应用场景。

写放大与 SSD 寿命

写放大现象在 B+tree 中尤为明显，尤其是在 SSD 上。为了写入少量有效数据，可能需要进行大量的磁盘写入，这直接影响 SSD 的使用寿命。因此，现代存储引擎在设计时需考虑写放大的优化策略，如使用 Write-Ahead Log 和 Page Compaction，以延长设备的使用时间。

❓

延伸问答

B-tree 的主要特点是什么？

B-tree 是一种自1972年提出的数据结构，适用于数据库和文件系统，能够减少随机读次数，提高查找效率，适合大规模数据存储。

B+tree 与 B-tree 有什么区别？

B+tree 只在叶子节点存储数据，内部节点仅存储键和指针，且叶子节点之间有双向链表，优化了范围查询和并发控制。

B-tree 如何保持平衡？

B-tree 通过节点分裂和合并来保持平衡，分裂时将中位数键上提到父节点，合并时从兄弟节点借键或合并。

批量加载对 B-tree 的构建效率有什么影响？

批量加载可以显著提高 B-tree 的构建效率，减少 I/O 次数，相比逐条插入，批量加载的 I/O 次数大幅降低。

写放大对 B+tree 有什么影响？

写放大指为了写入1字节有效数据，实际需要写入更多字节，B+tree 的写放大会影响 SSD 的寿命，因此需要优化写入策略。

现代存储引擎如何使用 B-tree？

现代存储引擎如 InnoDB 和 PostgreSQL 基于 B-tree 设计，适应硬件演进，继续在数据库中发挥重要作用。

🏷️