土法炼钢兴趣小组的博客 ·

向量化哈希：xxHash3 与 wyhash 的 SIMD 实现

💡 原文中文，约11800字，阅读约需29分钟。

📝

内容提要

xxHash3和wyhash是两种高效的哈希函数。xxHash3通过多个累加器并行处理，优化长输入的性能；wyhash则利用简单的乘法操作实现高效混合。两者在短键处理上表现优异，尤其是wyhash，代码简洁且性能接近最优。

🎯

❓

xxHash3采用显式SIMD设计，通过多个独立的累加器并行处理，而wyhash则使用隐式指令级并行（ILP），依赖简单的乘法操作实现高效混合。

哈希函数需要使用SIMD来消除数据依赖，提高处理速度，使CPU的向量单元能够满载运转，从而提升性能。

wyhash在短键处理上表现优异，延迟低于其他哈希函数，特别是通过一次MUM操作就能高效处理短键。

在长输入处理上，xxHash3的性能在内存带宽成为瓶颈时与wyhash的差距缩小，但仍然在长输入上表现出色，吞吐量高。

设计哈希函数时需消除循环依赖，选择合适的混合操作，确保终结化充分混合，并分开处理短键和长键。

xxHash3的代码量是wyhash的10倍以上，追求极致性能，而wyhash则以简洁的代码实现接近最优性能。

🏷️

重新思考现代数据平台的SQL ETL
SQL ETL实施面临碎片化挑战，导致操作复杂且难以扩展。Databricks通过统一平台整合执行、调度和监控，简化数据管道管理，提升性能和可靠性，支持多...
《樱花萌放》小黑线·游戏原案
旁白：......倏倏地, 旁白：......樱满落。旁白：世界于此,暂作叹息。旁白：満月·夜の国旁白：·十·年·前。旁白 ... The pos...
《樱花萌放》小春线·游戏原案
旁白：去寻找我们失去的过去和未来吧。旁白：选择：小小的石桥旁白：参禅町·石桥旁白：我们的小镇,参禅町,有一条河贯穿其间。旁 ... The pos...
《樱花萌放》千和线·游戏原案
旁白：选择：在大街上漫步旁白：参禅町·大通り2 旁白：来到了小镇的大街上。姬织：「哇,人真多啊——」旁白：意外的——虽然不确 ... The pos...
《樱花萌放》姬织线·游戏原案
旁白：満月·夜の国旁白：世界于此,暂作叹息—— 旁白：于我胸中回响、旁白：于我眼中闪烁、旁白：......于我心中荡漾。旁 ... The pos...
Cloudflare IPsec的后量子加密现已普遍可用
Cloudflare宣布其IPsec服务现已支持后量子加密，旨在抵御“先收集后解密”的攻击。该技术采用混合ML-KEM算法，确保与Cisco和Fortin...