小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
机械同情原则

现代硬件性能强大,但软件往往未能充分利用。机械同情是指开发与硬件相适应的软件,其原则包括可预测的内存访问、缓存行意识、单写者原则和自然批处理。这些原则有助于优化AI推理服务器和分布式数据平台。通过理解CPU的内存存储和访问方式,开发者可以提升性能,避免虚假共享等问题。优先考虑可观察性和明确性能目标是有效优化软件的关键。

机械同情原则

Martin Fowler
Martin Fowler · 2026-04-07T13:39:00Z

在CSAPP缓存实验中,学生编写C程序模拟缓存内存,参数包括缓存组数、每组行数、块大小和内存地址位数。程序处理内存访问,采用LRU替换策略,最终统计命中、未命中和驱逐次数,加深对计算机系统核心概念的理解。

CSAPP缓存实验 I:让我们模拟缓存内存!

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-04T16:45:09Z

CSAPP缓存实验要求学生编写C程序模拟缓存内存,定义缓存的参数包括组数、每组行数、块大小和内存地址位数。程序处理加载、存储和修改数据的内存访问操作,并采用LRU策略进行缓存替换。通过构建模拟器,学生加深了对计算机系统核心概念的理解,并为优化实际代码奠定基础。

CSAPP缓存实验I:让我们模拟一个缓存内存!

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-04T16:45:09Z
A segmentation error occurred 原因与解决方法

朋友在使用HyperMesh2025时遇到分段错误,可能由内存访问违规、软件兼容性或系统资源不足引起。解决方法包括检查兼容性、释放内存、删除临时文件、修复或重装软件、检查更新和审查错误日志。尽管服务器配置高,仍需关注电脑配置是否足够。

A segmentation error occurred 原因与解决方法

付杰博客
付杰博客 · 2025-12-12T07:50:55Z

ACCESS_ONCE() 是 Linux 源码中的宏,确保编译器不会合并或重新获取对标量类型的访问。它通过将变量转为 volatile 类型,防止编译器优化引发错误。READ_ONCE() 和 WRITE_ONCE() 适用于非标量类型,主要用于进程与中断处理之间的通信,确保内存访问顺序性。

ACCESS_ONCE()/WRITE_ONCE()/READ_ONCE()

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-10-30T05:01:06Z
GSoC 2025 - 字节类型:支持LLVM IR中的原始数据拷贝

在GSoC 2025项目中,Pedro Lobo为LLVM IR引入了新的字节类型,解决了内存访问问题,改进了memcpy和memcmp等内置函数,提升了优化能力,且对性能影响极小。

GSoC 2025 - 字节类型:支持LLVM IR中的原始数据拷贝

The LLVM Project Blog
The LLVM Project Blog · 2025-09-08T00:00:00Z
CUDA核心转储:有效的调试工具,用于解决内存访问问题及其他

CUDA核心转储是一种有效的调试工具,用于解决内存访问问题。通过设置环境变量,可以在发生非法内存访问时生成核心转储文件,帮助开发者准确定位问题,尤其在复杂的CUDA图中。建议使用特定的环境变量组合以优化调试体验。

CUDA核心转储:有效的调试工具,用于解决内存访问问题及其他

vLLM Blog
vLLM Blog · 2025-08-11T00:00:00Z

现代计算机的性能瓶颈已转向内存访问,缓存无关算法在所有层级缓存上实现最优性能,无需了解缓存参数。通过递归分解问题,缓存无关算法自动适应缓存大小,适用于矩阵运算和优先队列等场景,尽管常数因子较大,但其理论价值在于揭示了不依赖硬件参数的通用最优策略。

缓存无关算法:让硬件替你优化

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z
掌握C# 14中的隐式Span转换 — 性能与安全

C# 14引入了Span<T>和ReadOnlySpan<T>,支持隐式转换,简化数组和字符串等数据结构的操作。这些类型安全高效,避免堆分配,适合高性能内存访问。建议在需要可变性时使用Span<T>,否则使用ReadOnlySpan<T>。

掌握C# 14中的隐式Span转换 — 性能与安全

DEV Community
DEV Community · 2025-05-06T23:20:01Z
[VMPwn] 老头初探 QEMU 逃逸

本文探讨了QEMU虚拟机逃逸的基本概念和技术细节,重点分析了如何利用有漏洞的PCI设备实现虚拟机对宿主机内存的访问。文章详细介绍了PCI设备的结构、MMIO和PMIO的访问方式,以及通过特定代码进行内存映射和输入输出操作,从而实现对宿主机的控制。

[VMPwn] 老头初探 QEMU 逃逸

ネコのメモ帳
ネコのメモ帳 · 2025-05-06T00:00:00Z

C#中的Span<T>类型显著提升数据处理性能,尤其在重构foreach循环时。它提供高效的内存访问,避免不必要的内存分配,性能提升可达300%。使用时需注意数据生命周期的安全性,掌握Span<T>是提升C#开发性能的关键。

颠覆认知!用Span重构foreach循环竟让数据处理快如闪电

dotNET跨平台
dotNET跨平台 · 2025-05-05T00:13:04Z
SeedLM:将大型语言模型权重压缩为伪随机生成器的种子

大型语言模型(LLMs)在自然语言处理领域取得了突破,但因运行成本高而难以广泛应用。本文提出了一种新颖的后训练压缩方法SeedLM,通过伪随机生成器的种子编码和压缩模型权重,利用线性反馈移位寄存器生成随机矩阵,结合压缩系数重构权重块。SeedLM减少内存访问,提升内存密集型任务的速度,且无需校准数据,适用于多种任务。实验表明,SeedLM在4位和3位压缩下的零-shot准确率与最先进方法相当,并在FPGA测试中显示出显著加速效果。

SeedLM:将大型语言模型权重压缩为伪随机生成器的种子

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-04T00:00:00Z

变压器架构在人工智能任务中广泛应用,尤其是大型语言模型。注意力层是性能瓶颈,需优化。分析显示,预填充阶段计算密集,解码阶段则内存密集。优化注意力层可提升性能,减少内存访问是关键。

变压器基础注意力性能理论分析

Lei Mao's Log Book
Lei Mao's Log Book · 2025-01-27T08:00:00Z

本文讨论了Bochs在x86_64长模式下的内存访问流程,特别是TLB(翻译后备缓冲区)的设置。强调在不允许通过主机指针直接访问页面时,TLB应设置TLB_NoHostPtr位,未设置该位的直接访问请求会导致TLB未命中。

Bochs代码阅读、笔记与技巧

shrik3
shrik3 · 2024-10-09T16:15:10Z

本文讨论了Bochs的代码阅读和黑客技巧,重点介绍了CPU的基本循环、内存访问流程及多处理器配置的实现。还提到如何使用宏定义简化函数调用,并解释了指令执行和内存操作的细节。

Bochs代码阅读、笔记与技巧

shrik3
shrik3 · 2024-10-09T16:15:10Z

DMA(直接内存访问)是一种高效的数据传输方法,允许数据直接从一个地址空间复制到另一个地址空间,实现外设和内存之间的快速数据传输。DMA消除了CPU参与数据传输的需求,使其能够专注于更复杂的任务。DMA可用于各种数据传输场景,如外设到内存、内存到外设、内存到内存和外设到外设。DMA参数包括源地址、目标地址、数据传输大小和传输模式。DMA通道可以配置不同的优先级,并可为各种事件生成中断。DMA可以显著提高微控制器系统中的数据传输效率。

搞嵌入式,不懂DMA?笑死人。。。

良许Linux教程网
良许Linux教程网 · 2024-04-12T14:43:16Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码