小红花·文摘

文章讨论了在多核处理器上使用__rdtsc()指令进行微基准测试的优缺点。该指令提供高精度时间测量，但在不同核心间可能存在同步性问题。尽管现代处理器通常具有不变的时间戳计数器（TSC），但频率调节和上下文切换等因素可能影响性能测量的准确性。因此，在多核环境下使用RDTSC需谨慎。

OpenBSD 比 Linux 快 10 倍？

程序师 ·

多核处理器芯片由多个单线程核心组成，每个核心有自己的私有数据缓存，最后级缓存（LLC）由所有核心共享。缓存一致性协议分为一致性无关和一致性导向两类，前者确保写操作在返回前对所有核心可见，后者允许写操作异步传播。维护一致性需定义多个不变性，如单写多读不变性和数据值不变性，缓存一致性在所有存储结构中相关，包括L1、L2缓存和主内存。

Go中秘而不宣的数据结构 CacheLinePad：精细化优化

鸟窝 ·

Java并行流是利用多核处理器计算能力的新途径，可以更有效地处理数据密集型操作。并行流将数据源分成多个段，在不同线程间同时处理，提高性能。并行流适用于CPU密集型任务，但不适用于内存密集型操作。使用并行流需注意线程安全和共享可变状态。最佳实践包括优先处理CPU密集型任务、避免共享可变状态、考虑数据大小和性质、注意操作顺序、测试性能。并行流是Java开发人员的强大工具，可以创建高效、高性能、健壮、可维护的应用程序。

掌握Java并行流：提高现代应用程序的性能

极道 ·

本文研究了多核处理器和加速器的性能和功耗数字现状，发现了一些趋势，包括功耗、数字精度和推理与训练等方面的趋势。作者测试了两个商用加速器的实际表现，并将其与报道的性能和功耗数值进行比较，同时与嵌入式应用程序中使用的 Intel CPU 进行评估。

林肯人工智能计算调查 (LAICS) 更新

BriefGPT - AI 论文速递 ·

本课程是一个简短的教程，教你如何编写能够利用多核处理器和大型计算集群的Python脚本。课程基于Python，但适用于各种语言。在学习本课程之前，你应该对Python有良好的基本理解。本课程将让你了解函数式编程以及如何使用它来编写高效的并行代码。请按照自己的节奏学习本课程，并通过复制示例和完成练习来加深理解。

Python Load 183

蠎周刊 ·

OpenBSD 比 Linux 快 10 倍？

MC-01h - 一致性介绍

Intel Gracemont 微架构评测

Go中秘而不宣的数据结构 CacheLinePad：精细化优化

掌握Java并行流：提高现代应用程序的性能

林肯人工智能计算调查 (LAICS) 更新

Python Load 183