小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Go 1.27 将默认开启 SIMD for amd64,可移植 SIMD 包提案出炉

Go 1.27默认开启SIMD支持,解决了性能瓶颈。新版本引入架构绑定的simd/archsimd和架构无关的simd,提升了可移植性和性能。开发者可通过简单API实现高效向量操作,简化不同CPU的优化过程,标志着Go语言在性能领域的重大进步。

Go 1.27 将默认开启 SIMD for amd64,可移植 SIMD 包提案出炉

Tony Bai
Tony Bai · 2026-04-29T00:16:43Z

Google 的 Swiss Table 是一种高效的哈希表实现,利用 SIMD 指令实现 16 路并行探测,性能比传统的 std::unordered_map 快 2 倍以上。它通过控制字节优化内存访问,减少缓存未命中率,提升查找效率,并采用开放寻址策略,解决了链式哈希的内存开销和性能瓶颈问题。

Swiss Table:Google 的 SIMD 加速哈希表

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-07T00:00:00Z

asmkit-rs 是一个 Rust 汇编工具库,支持动态生成和执行机器码,核心组件包括代码缓冲区、汇编器和 JIT 内存分配器。示例展示了 SIMD 向量加法的执行。Avian Physics 0.6 发布,新增移动与滑动功能、关节马达支持及优化,提升性能并提供运动学角色控制器示例。

【Rust日报】2026-03-19 Avian Physics 0.6 发布

Rust.cc
Rust.cc · 2026-03-19T06:02:55Z
使用RUST进行SIMD编程

本文介绍如何在纯Rust中编写SIMD加速代码,强调AMD Zen 5 CPU对AVX-512指令的支持。SIMD工作流程包括加载、计算和存储,减少内存访问至关重要。作者期待可移植的SIMD特性进入稳定版,以简化跨平台开发。使用SIMD可以显著提升性能,而Rust使实现过程更加简单。

使用RUST进行SIMD编程

Teach Talk
Teach Talk · 2026-01-27T06:17:51Z

AMD Zen 5 CPU在性能上取得突破,支持AVX-512指令,提升了SIMD编程效率。使用纯Rust编写的SIMD代码可显著提升性能,适用于多平台。Servo浏览器引擎新增多窗口和代理支持,并改进了开发者工具和Web功能。

【Rust日报】2026-01-22 AMD Zen 5 的性能突破 & SIMD 编程在纯 Rust 中的应用

Rust.cc
Rust.cc · 2026-01-25T04:50:57Z

Go 2026规划揭示了未来技术变革,重点包括SIMD、手动内存管理和无C工具链,以提升性能和表达力,满足AI和高频交易需求。新特性如泛型方法和联合类型将增强语言灵活性,推动Go语言向全能计算平台发展。

Go 2026 路线图曝光:SIMD、泛型方法与无 C 工具链 CGO —— 性能与表达力的双重飞跃?

Tony Bai
Tony Bai · 2025-11-28T00:45:22Z

本文介绍了Wojciech Mula的“SIMD字符串查找”方法,利用SIMD技术在字符串中高效查找字符。通过并行比较和位掩码,快速定位字符位置,减少无效比较。同时讨论了跨页处理和内存管理策略,以避免越界错误,并提供了示例代码以实现字符查找和子串匹配。

SIMD 加速字符串查找(strchr / strstr)系统指南

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-11-13T00:00:00Z

Go 1.26引入SIMD特性以提升性能,但创始人Rob Pike对此表示担忧,认为这会增加复杂性和不兼容性。他强调Go语言应保持简单,而Go团队则通过//cpu:requires指令和静态分析工具vet来管理新复杂性,确保代码安全性。这场辩论反映了Go设计哲学从追求简单到务实管理复杂性的演变。

连 Rob Pike 都感到“担忧”:Go 1.26 SIMD 引入的新复杂性与应对之道

Tony Bai
Tony Bai · 2025-11-06T00:17:44Z

Go语言即将推出SIMD包,以提升程序性能。SIMD(单指令多数据流)可通过一条指令同时处理多个数据,适用于科学计算等任务。新包包含底层和高层API,开发者可立即体验。尽管SIMD能显著加速计算,但需关注硬件特性和内存瓶颈。

解锁 CPU 终极性能:Go 原生 SIMD 包预览版初探

Tony Bai
Tony Bai · 2025-08-22T01:22:10Z
【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

文章讨论了使用纯 Rust 实现 ChaCha20/ChaCha12 算法的 SIMD 加速经验,强调了并行化和数据块处理的加速思路。作者选择了 std::arch 原始 intrinsic 实现,认为 Rust 在不牺牲安全性的前提下,能够接近汇编性能,并期待 portable_simd 的稳定发布。

【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

Rust.cc
Rust.cc · 2025-08-21T05:37:31Z

本文探讨了在Rust中实现SIMD加速的两种方法:将输入数据拆分为多个块进行并行处理,以及寻找可并行执行的算法。强调了SIMD寄存器的重要性,介绍了ChaCha20和BLAKE3的实现,并讨论了CPU特性检测和Rust中的不同SIMD实现方式。最后提到可移植的SIMD将简化代码的维护和测试,并展望其在Rust稳定版中的应用。

在纯Rust中实现SIMD加速算法的经验教训

程序师
程序师 · 2025-08-18T00:30:34Z

在.NET 8中,C#开发者可以通过理解CPU架构、利用SIMD技术、优化算法与数据结构以及并行编程来提升CPU性能。同时,原生AOT编译和改进的JIT编译器也能显著提高应用程序的效率。

微软工程师不会告诉你的.NET8秘密:如何用C#榨干CPU性能?

dotNET跨平台
dotNET跨平台 · 2025-08-07T23:57:03Z

本文探讨了如何通过循环展开、消除边界检查和整数量化等技术优化Go语言中的点积运算函数,最终采用SIMD指令实现,性能提升达530%,内存使用减少四倍,满足客户需求。

Go语言优化之道:从低效实现到SIMD加速

程序师
程序师 · 2025-07-28T03:02:13Z

这篇文章探讨了SIMD编程的设计模式,强调数据布局的重要性,提出SoA(结构数组)相较于AoS(数组结构)的优势。介绍了无分支条件赋值的mask + blend方法,以及pshufb指令在字节查表和前缀和实现中的应用。最后,讨论了AVX-512的新特性和跨平台的SIMD策略,建议使用Google Highway库进行跨平台开发。

SIMD 算法设计模式

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z

xxHash3和wyhash是两种高效的哈希函数。xxHash3通过多个累加器并行处理,优化长输入的性能;wyhash则利用简单的乘法操作实现高效混合。两者在短键处理上表现优异,尤其是wyhash,代码简洁且性能接近最优。

向量化哈希:xxHash3 与 wyhash 的 SIMD 实现

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z
新直播 – Java 启用预览:Vector API

本文与Daniel Hinojosa一起探讨Java中的Vector API,介绍其在高性能代码编写中的应用,包括SIMD技术、Vector API的设置、组件、掩码应用及性能比较,主要面向后端开发者和软件架构师。

新直播 – Java 启用预览:Vector API

The JetBrains Blog
The JetBrains Blog · 2025-06-16T10:18:02Z

2025年Stackoverflow开发者调查问卷已启动,关注AI相关问题。Rust音频库cpal寻求维护者,并讨论Rust中的SIMD编程、日志搜索效率及零成本函数式风格等新技术和库。

【Rust日报】2025-06-09 Stackoverflow 2025 开发者调查问卷已开始

Rust.cc
Rust.cc · 2025-06-09T02:16:17Z

Go语言团队提出#73787提案,引入SIMD内置函数,以提升性能并简化开发者对底层硬件加速的使用。提案分为两步:首先提供架构特定的低级API,其次构建可移植的高级API,从而降低使用门槛,促进高性能计算的发展。

告别手写汇编:Go官方提出原生SIMD支持,高性能计算将迎来巨变

Tony Bai
Tony Bai · 2025-06-08T23:09:58Z
提高Solana的区块限制:SIMD-0250及其经济影响

SIMD-0250提议将Solana网络的最大区块计算单位提高至6000万,以提升交易处理能力、减少拥堵和降低费用。尽管对验证者的硬件要求增加,但开发者可以利用更多计算资源来改善应用性能。此变更需确保基础设施跟上,以避免潜在的延迟和失败。

提高Solana的区块限制:SIMD-0250及其经济影响

DEV Community
DEV Community · 2025-05-09T06:51:57Z
FFmpeg H.265解码WASM SIMD优化进展

本文介绍了H.265解码中使用WASM SIMD128加速技术,显著提升了IDCT和帧间预测的解码速度。通过性能优化和Linux perf工具定位热点函数,优化算法实现,测试一致性和速度,最终实现了显著加速效果。

FFmpeg H.265解码WASM SIMD优化进展

实时互动网
实时互动网 · 2025-04-24T02:06:54Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码