小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Daniel Lemire 的研究表明,传统的二分搜索算法可以被更高效的 'SIMD Quad' 算法超越。该算法结合了 SIMD 和四叉搜索的优势,利用现代处理器的并行能力,显著提高了搜索速度。基准测试显示,SIMD Quad 在冷缓存情况下的加速效果尤为明显,强调了算法设计应考虑硬件特性。

读:教科书二分搜索能被超越——SIMD 与四叉搜索的启示

暗无天日
暗无天日 · 2026-05-28T00:00:00Z

字符串处理是后端系统的性能瓶颈,使用SIMD指令集(如SSE2、AVX2、ARM NEON)可以显著提升性能。文章探讨了字符串操作的实现,包括memchr、strlen和JSON解析等,使用SIMD后性能可提升10倍以上,适用于高效的JSON和CSV解析。最后总结了SIMD编程的经验和常见陷阱。

SIMD 字符串处理进阶

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-26T00:00:00Z

搜索引擎的倒排索引需要高效的整数压缩以节省存储和提高查询速度。文章介绍了多种压缩算法,如varint、PForDelta、SIMD-BP128和Roaring Bitmap,分析了它们的优缺点及应用场景。选择合适的算法需考虑数据特性和性能需求。

整数压缩:varint → PForDelta → SIMD-BP128

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-12T00:00:00Z
Go 1.27 将默认开启 SIMD for amd64,可移植 SIMD 包提案出炉

Go 1.27默认开启SIMD支持,解决了性能瓶颈。新版本引入架构绑定的simd/archsimd和架构无关的simd,提升了可移植性和性能。开发者可通过简单API实现高效向量操作,简化不同CPU的优化过程,标志着Go语言在性能领域的重大进步。

Go 1.27 将默认开启 SIMD for amd64,可移植 SIMD 包提案出炉

Tony Bai
Tony Bai · 2026-04-29T00:16:43Z

Google 的 Swiss Table 是一种高效的哈希表实现,利用 SIMD 指令实现 16 路并行探测,性能比传统的 std::unordered_map 快 2 倍以上。它通过控制字节优化内存访问,减少缓存未命中率,提升查找效率,并采用开放寻址策略,解决了链式哈希的内存开销和性能瓶颈问题。

Swiss Table:Google 的 SIMD 加速哈希表

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-07T00:00:00Z

asmkit-rs 是一个 Rust 汇编工具库,支持动态生成和执行机器码,核心组件包括代码缓冲区、汇编器和 JIT 内存分配器。示例展示了 SIMD 向量加法的执行。Avian Physics 0.6 发布,新增移动与滑动功能、关节马达支持及优化,提升性能并提供运动学角色控制器示例。

【Rust日报】2026-03-19 Avian Physics 0.6 发布

Rust.cc
Rust.cc · 2026-03-19T06:02:55Z
使用RUST进行SIMD编程

本文介绍如何在纯Rust中编写SIMD加速代码,强调AMD Zen 5 CPU对AVX-512指令的支持。SIMD工作流程包括加载、计算和存储,减少内存访问至关重要。作者期待可移植的SIMD特性进入稳定版,以简化跨平台开发。使用SIMD可以显著提升性能,而Rust使实现过程更加简单。

使用RUST进行SIMD编程

Teach Talk
Teach Talk · 2026-01-27T06:17:51Z

AMD Zen 5 CPU在性能上取得突破,支持AVX-512指令,提升了SIMD编程效率。使用纯Rust编写的SIMD代码可显著提升性能,适用于多平台。Servo浏览器引擎新增多窗口和代理支持,并改进了开发者工具和Web功能。

【Rust日报】2026-01-22 AMD Zen 5 的性能突破 & SIMD 编程在纯 Rust 中的应用

Rust.cc
Rust.cc · 2026-01-25T04:50:57Z

Go 2026规划揭示了未来技术变革,重点包括SIMD、手动内存管理和无C工具链,以提升性能和表达力,满足AI和高频交易需求。新特性如泛型方法和联合类型将增强语言灵活性,推动Go语言向全能计算平台发展。

Go 2026 路线图曝光:SIMD、泛型方法与无 C 工具链 CGO —— 性能与表达力的双重飞跃?

Tony Bai
Tony Bai · 2025-11-28T00:45:22Z

本文介绍了Wojciech Mula的“SIMD字符串查找”方法,利用SIMD技术在字符串中高效查找字符。通过并行比较和位掩码,快速定位字符位置,减少无效比较。同时讨论了跨页处理和内存管理策略,以避免越界错误,并提供了示例代码以实现字符查找和子串匹配。

SIMD 加速字符串查找(strchr / strstr)系统指南

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-11-13T00:00:00Z

Go 1.26引入SIMD特性以提升性能,但创始人Rob Pike对此表示担忧,认为这会增加复杂性和不兼容性。他强调Go语言应保持简单,而Go团队则通过//cpu:requires指令和静态分析工具vet来管理新复杂性,确保代码安全性。这场辩论反映了Go设计哲学从追求简单到务实管理复杂性的演变。

连 Rob Pike 都感到“担忧”:Go 1.26 SIMD 引入的新复杂性与应对之道

Tony Bai
Tony Bai · 2025-11-06T00:17:44Z

Go语言即将推出SIMD包,以提升程序性能。SIMD(单指令多数据流)可通过一条指令同时处理多个数据,适用于科学计算等任务。新包包含底层和高层API,开发者可立即体验。尽管SIMD能显著加速计算,但需关注硬件特性和内存瓶颈。

解锁 CPU 终极性能:Go 原生 SIMD 包预览版初探

Tony Bai
Tony Bai · 2025-08-22T01:22:10Z
【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

文章讨论了使用纯 Rust 实现 ChaCha20/ChaCha12 算法的 SIMD 加速经验,强调了并行化和数据块处理的加速思路。作者选择了 std::arch 原始 intrinsic 实现,认为 Rust 在不牺牲安全性的前提下,能够接近汇编性能,并期待 portable_simd 的稳定发布。

【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

Rust.cc
Rust.cc · 2025-08-21T05:37:31Z

本文探讨了在Rust中实现SIMD加速的两种方法:将输入数据拆分为多个块进行并行处理,以及寻找可并行执行的算法。强调了SIMD寄存器的重要性,介绍了ChaCha20和BLAKE3的实现,并讨论了CPU特性检测和Rust中的不同SIMD实现方式。最后提到可移植的SIMD将简化代码的维护和测试,并展望其在Rust稳定版中的应用。

在纯Rust中实现SIMD加速算法的经验教训

程序师
程序师 · 2025-08-18T00:30:34Z

在.NET 8中,C#开发者可以通过理解CPU架构、利用SIMD技术、优化算法与数据结构以及并行编程来提升CPU性能。同时,原生AOT编译和改进的JIT编译器也能显著提高应用程序的效率。

微软工程师不会告诉你的.NET8秘密:如何用C#榨干CPU性能?

dotNET跨平台
dotNET跨平台 · 2025-08-07T23:57:03Z

本文探讨了如何通过循环展开、消除边界检查和整数量化等技术优化Go语言中的点积运算函数,最终采用SIMD指令实现,性能提升达530%,内存使用减少四倍,满足客户需求。

Go语言优化之道:从低效实现到SIMD加速

程序师
程序师 · 2025-07-28T03:02:13Z

这篇文章探讨了SIMD编程的设计模式,强调数据布局的重要性,提出SoA(结构数组)相较于AoS(数组结构)的优势。介绍了无分支条件赋值的mask + blend方法,以及pshufb指令在字节查表和前缀和实现中的应用。最后,讨论了AVX-512的新特性和跨平台的SIMD策略,建议使用Google Highway库进行跨平台开发。

SIMD 算法设计模式

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z

xxHash3和wyhash是两种高效的哈希函数。xxHash3通过多个累加器并行处理,优化长输入的性能;wyhash则利用简单的乘法操作实现高效混合。两者在短键处理上表现优异,尤其是wyhash,代码简洁且性能接近最优。

向量化哈希:xxHash3 与 wyhash 的 SIMD 实现

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z
新直播 – Java 启用预览:Vector API

本文与Daniel Hinojosa一起探讨Java中的Vector API,介绍其在高性能代码编写中的应用,包括SIMD技术、Vector API的设置、组件、掩码应用及性能比较,主要面向后端开发者和软件架构师。

新直播 – Java 启用预览:Vector API

The JetBrains Blog
The JetBrains Blog · 2025-06-16T10:18:02Z

2025年Stackoverflow开发者调查问卷已启动,关注AI相关问题。Rust音频库cpal寻求维护者,并讨论Rust中的SIMD编程、日志搜索效率及零成本函数式风格等新技术和库。

【Rust日报】2025-06-09 Stackoverflow 2025 开发者调查问卷已开始

Rust.cc
Rust.cc · 2025-06-09T02:16:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码