土法炼钢兴趣小组的博客 ·

从零写一个 LSM-Tree 存储引擎

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

该系列文章通过五篇深入探讨如何从零构建LSM-Tree KV存储引擎，涵盖设计决策、组件功能及Rust重写，涉及WAL、MemTable、SSTable、Compaction等关键概念，最终提供完整引擎及性能对比。

🎯

❓

LSM-Tree是一种用于高效处理写入操作的键值存储引擎，主要通过将随机写转换为顺序写来提高性能。

WAL（写前日志）和MemTable用于解决数据持久性与写入速度之间的矛盾，确保在崩溃时数据不会丢失。

Compaction是LSM-Tree的关键过程，能够减少读放大和空间放大的问题，确保存储引擎的高效运行。

通过数据块前缀压缩和双重哈希的Bloom Filter，可以在存储中实现高效的空间利用和快速查询。

Rust重写后，通过基准测试显示了在并发控制和崩溃恢复流程上的性能提升，优化了整体架构选择。

延伸阅读部分分析了LevelDB的LRU Cache实现和参数调优，帮助用户更深入理解引擎行为。

🏷️

【Rust日报】2026-04-01 Slint 1.16 ：在所有平台上弃用原生外观
Slint 1.16 版本将弃用其他内置样式，Fluent 成为默认样式，以保持各平台的交互一致性。Zench 0.2.0 是 Rust 的基准测试工具，...
通过Gemini API文档MCP和代理技能提升编码代理的性能
Gemini API文档MCP通过模型上下文协议连接编码代理与最新的Gemini API文档、SDK和模型信息，确保编码代理能够访问最新的API和最佳配置。
从张雪机车的故事聊人生，相同之处是同是湖南人。
最近最火不过于这个现实版的飞驰人生，一个好故事。在AI替代与35岁危机下的背景下，这类故事就是一束光，这是好过于任何所谓提振消费的手段。早几年前看过一些...
How to integrate VS Code with Ollama for local AI assistance
If you’re starting your journey as a programmer and want to jump-start that p...
泄露的Claude Code源代码内幕：代理群、守护进程及Anthropic隐藏的44个功能
On Wednesday, security researcher Chaofan Shou discovered that Anthropic had ...
甲骨文在美国和印度等地裁员最多3万人没有提前通知和沟通直接发邮件裁员
甲骨文计划裁员2万至3万名员工，裁员通知通过电子邮件发送，未提前告知。分析师认为此举与公司AI投资有关，旨在释放80至100亿美元现金流。