土法炼钢兴趣小组的博客 ·

完美哈希：从理论到 gperf 实践

💡 原文中文，约22800字，阅读约需55分钟。

📝

内容提要

本文讨论了完美哈希在编程语言关键字识别中的应用，完美哈希函数确保零冲突，查找时间为O(1)。GCC使用gperf生成C/C++关键字的完美哈希函数。文章介绍了FKS方案、最小完美哈希及其构造算法，如CHD和RecSplit，强调了完美哈希在静态字典问题中的优势，适用于高频查找和确定性延迟的场景。

🎯

❓

完美哈希函数确保零冲突，查找时间为O(1)。

gperf是为小规模静态字符串集合生成完美哈希函数的标准工具，广泛应用于编译器中。

最小完美哈希函数将n个键双射到[0,n)，其空间下界约为1.44 bits/key。

FKS方案通过两级哈希结构，将n个键分到m个桶中，允许冲突，然后在每个桶内使用独立的哈希函数消除冲突。

CHD算法包括三个步骤：哈希、位移和压缩，用于构造最小完美哈希函数。

完美哈希适合静态键集合、高频查找和需要确定性延迟的场景，如编译器关键字识别和静态路由表。

🏷️

Radim Marek：pg_stat_statements：它告诉你的所有信息
pg_stat_statements是PostgreSQL的扩展，用于监控数据库查询性能。它通过哈希表记录查询的执行次数和总时间，但不保存具体查询文本。查...
我体验了下一代手持设备
MSI Claw 8 EX AI Plus手持设备搭载Intel Arc G3 Extreme芯片，性能和电池续航显著提升。在1080p高设置下可流畅运行...
Rayfin：微软对氛围编码与企业级生产之间差距的回应
微软在Build 2026上推出了Rayfin，这是一个开源SDK和CLI，旨在简化企业应用程序的开发和部署。Rayfin允许开发者通过代码定义应用后端，...
微软押注企业AI竞赛将依赖数据上下文而非模型能力
微软在Build 2026开发者大会上推出了Microsoft Fabric，旨在解决企业AI中的数据上下文问题。新平台包括HorizonDB数据库、GP...
第737期：Polars 1.41、电子邮件、优秀文档及更多内容（2026-06-02）
Polars 1.41版本发布，新增快速的parquet元数据解码和嵌套子计划消除等功能。
微软Build 2026：七大重要公告
微软在Build 2026大会上发布了多项人工智能创新，包括Surface RTX Spark开发盒、开发者友好的Windows更新、基于Android的...