土法炼钢兴趣小组的博客 ·

LSM-Tree 全景：为什么要先写日志再排序

💡 原文中文，约7700字，阅读约需19分钟。

📝

内容提要

LSM-Tree（日志结构合并树）是一种适合写入远多于读取的存储系统的结构。其核心思想是将数据先写入内存中的有序结构，再顺序写入磁盘，以避免随机写入的性能瓶颈。与B-Tree相比，LSM-Tree通过追加写和后台归并优化写入性能，适合时序数据库和日志存储。文章介绍了LSM-Tree的组件及其工作原理，包括WAL、MemTable、SSTable和Compaction等。

🎯

关键要点

LSM-Tree（日志结构合并树）适合写入远多于读取的存储系统，如时序数据库和日志存储。
LSM-Tree的核心思想是将数据先写入内存中的有序结构，再顺序写入磁盘，以避免随机写入的性能瓶颈。
与B-Tree相比，LSM-Tree通过追加写和后台归并优化写入性能，适合写密集场景。
LSM-Tree的主要组件包括WAL（写前日志）、MemTable、SSTable（有序字符串表）和Compaction（归并整理）。
WAL用于确保数据在崩溃后能够恢复，MemTable是内存中的有序写缓冲区，SSTable是磁盘上的不可变有序文件。
Compaction的作用是后台归并整理，防止SSTable文件数量过多导致性能下降。
LSM-Tree的设计权衡包括写放大、读放大和空间放大，三者之间存在不可兼得的关系。
现实世界中，LevelDB和RocksDB等系统都基于LSM-Tree架构，适用于高写入负载的场景。

🔎

延伸解读

LSM-Tree的适用场景

LSM-Tree特别适合写入远多于读取的场景，如时序数据库和日志存储。这是因为其设计能够有效减少随机写入带来的性能瓶颈，确保在高写入负载下仍能保持较高的写入效率。

写放大与读放大的权衡

LSM-Tree在设计上存在写放大和读放大的权衡。虽然写放大可能高达70倍，但由于其顺序写的特性，整体性能仍优于B-Tree的随机写。读放大则可能导致在查找不存在的key时需要多次磁盘读取，因此在设计时需考虑具体的使用场景。

Compaction的重要性

Compaction是LSM-Tree中不可或缺的部分，负责后台归并整理数据，防止SSTable文件数量过多导致性能下降。合理的Compaction策略能够显著提升读取性能和空间利用率，因此在实际应用中需根据工作负载选择合适的策略。

❓

延伸问答

LSM-Tree的核心思想是什么？

LSM-Tree的核心思想是将数据先写入内存中的有序结构，再顺序写入磁盘，以避免随机写入的性能瓶颈。

LSM-Tree与B-Tree相比有什么优势？

LSM-Tree通过追加写和后台归并优化写入性能，适合写入量远大于读取的场景，而B-Tree在写密集场景下存在随机写的瓶颈。

LSM-Tree的主要组件有哪些？

LSM-Tree的主要组件包括WAL（写前日志）、MemTable、SSTable（有序字符串表）和Compaction（归并整理）。

WAL在LSM-Tree中有什么作用？

WAL用于确保数据在崩溃后能够恢复，数据必须先顺序追加到WAL文件，再写入MemTable。

Compaction在LSM-Tree中有什么重要性？

Compaction的作用是后台归并整理，防止SSTable文件数量过多导致性能下降，并确保数据的有序性。

LSM-Tree的设计权衡包括哪些方面？

LSM-Tree的设计权衡包括写放大、读放大和空间放大，三者之间存在不可兼得的关系。

🏷️