小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

华为副总裁陈林透露,昇腾950DT芯片将于8月上线,算力翻倍,内存带宽提升至4TB/s。950PR和950DT两个版本分别针对不同市场需求,前者降低成本,后者专注高带宽场景。DeepSeek将优先部署950DT,预计在8月推出新版本,进一步提升AI模型能力。

华为自研HBM性能翻倍!昇腾950DT芯片8月提前问世,DeepSeek将优先部署

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-08T01:58:14Z
NVIDIA Vera CPU在竞争中展现强劲实力

NVIDIA的Vera CPU在最新基准测试中表现优异,满足代理AI对快速核心和高内存带宽的需求。Vera采用定制的Olympus核心,提供高达1.2TB/s的内存带宽,性能较前代Grace CPU提升1.6倍,成为与Intel和AMD竞争的强大对手。预计将在下半年向合作伙伴提供。

NVIDIA Vera CPU在竞争中展现强劲实力

NVIDIA Blog
NVIDIA Blog · 2026-05-26T21:15:15Z
机器学习从业者的推测解码指南

本文介绍了推测解码的工作原理及其在大型语言模型推理中的应用。推测解码通过小型草稿模型生成多个候选标记,并利用大型目标模型并行验证,从而显著提高推理速度,达到2-3倍的加速效果。该方法有效解决了内存带宽瓶颈问题,适用于翻译、摘要等任务。选择合适的草稿模型是实现最佳效果的关键。

机器学习从业者的推测解码指南

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-11T11:00:11Z
本地 NVMe 存储高达 22.8TB 的 Amazon EC2 C8id、M8id 和 R8id 实例正式发布

亚马逊推出了新的EC2 C8id、M8id和R8id实例,基于NVMe SSD存储,计算性能提高43%,内存带宽增加3.3倍,适合计算和内存密集型工作负载,支持更大规模配置,现已在多个AWS区域可用。

本地 NVMe 存储高达 22.8TB 的 Amazon EC2 C8id、M8id 和 R8id 实例正式发布

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-04T08:43:00Z
全新通用型 Amazon EC2 M8a 实例现已推出

Amazon EC2 M8a 实例正式发布,基于第五代 AMD EPYC 处理器,性能提升高达 30%,内存带宽提高 45%。适合高性能应用,支持灵活配置,提供高达 75 Gbps 网络带宽,适用于通用型应用、财务和 ERP 系统,现已在多个 AWS 区域上线。

全新通用型 Amazon EC2 M8a 实例现已推出

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-11-28T06:17:02Z

搭载M5芯片的MacBook Pro外观和配置与前代相似,主要在NPU性能和内存带宽上有所提升。M5在CPU和GPU性能上略有提升,NPU性能显著增强,适合对性能有需求的用户。

AI 时代的新征程:M5 款 MacBook Pro 简谈

少数派
少数派 · 2025-11-07T07:21:51Z

CuTe的平铺复制技术用于高效的数据复制,主要在全局内存与共享内存之间进行向量化复制。文章介绍了TiledCopy和ThrCopy模板类,利用线程索引对源和目标张量进行分区,从而实现高效的平铺复制,提升内存带宽利用率,适合处理大规模张量。

CuTe平铺复制

Lei Mao's Log Book
Lei Mao's Log Book · 2025-10-16T07:00:00Z

文章探讨了原始Macintosh的屏幕分辨率为何为512×342。安迪·赫茨菲尔德指出,内存带宽是关键因素,限制了64K内存的使用。额外的内存带宽使得显示分辨率得以提升。设计时考虑了图形用户界面和打印效果,最终选择了这一分辨率以优化性能和成本。

为什么原始的Macintosh屏幕分辨率是512×342,而不是人们可能预期的512×384

程序师
程序师 · 2025-05-29T10:16:05Z

在首届云原生地理空间大会上,我分享了关于GPU加速的演讲,重点探讨地理空间工作负载及GPU优化的潜力。演讲展示了GPU的快速计算能力,讨论了I/O与计算的关系,强调高效数据处理和内存带宽的重要性。期待与更多人交流GPU加速的经验。

云原生地理空间大会(2025)

datasframe
datasframe · 2025-05-04T06:00:00Z
RISC-V 向量内存突破:速度提升 2 倍,功耗降低 30%

该研究提出了一种新架构,优化RISC-V处理器的向量内存访问,提升内存带宽利用率和访问模式,采用新型移位网络,使向量操作性能提高至2倍,并与现有RISC-V向量扩展兼容。

RISC-V 向量内存突破:速度提升 2 倍,功耗降低 30%

DEV Community
DEV Community · 2025-04-19T00:03:14Z
演讲:释放Llama的潜力:基于CPU的微调

Rajput强调理解硬件架构对性能优化的重要性,指出尽管LLM(如Llama)可在CPU上运行,但内存带宽和缓存的使用至关重要。通过优化软件与硬件的协同,可以显著提升性能。他还讨论了多线程和批处理的影响,建议在部署时考虑内存需求和实例配置,以避免性能瓶颈。

演讲:释放Llama的潜力:基于CPU的微调

InfoQ
InfoQ · 2025-04-07T11:48:00Z

屋顶线性能模型通过比较应用性能与机器能力,识别软件实现和架构设计中的瓶颈。模型中,x轴表示算术强度,y轴表示计算性能。应用性能受内存带宽和处理器峰值性能限制,低算术强度时受内存限制,高算术强度时受处理器限制。实际应用性能通常低于理论峰值,可能因内存带宽或处理器未充分利用。

屋顶线性能模型

Lei Mao's Log Book
Lei Mao's Log Book · 2025-03-26T07:00:00Z

本研究提出了PRESERVE框架,旨在解决大语言模型推理中的内存带宽瓶颈和设备间通信开销问题。通过优化内存读取和集体通信,该框架在商业AI加速器上实现了最高1.6倍的加速,显著提高了性能和成本效率。

PRESERVE: Prefetching Model Weights and KV-Cache in Distributed LLM Serving

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z
Intel UHD Graphics 730上的OpenCL性能评估

本文介绍了Intel UHD Graphics 730的性能参数,包括计算单元、时钟频率、内存带宽及其在单精度、半精度和整数计算等方面的能力。

Intel UHD Graphics 730上的OpenCL性能评估

DEV Community
DEV Community · 2025-01-13T04:05:17Z

选择本地大模型时,设备限制至关重要。文章讨论了模型推理的基本概念、计算过程及内存需求,强调内存带宽对推理速度的影响。建议选择性能与性价比兼具的设备,如M4 Mac mini或配备NVIDIA显卡的PC,以满足不同需求。

本地大模型之路(二):了解模型能力与性能需求,让硬件选购恰到好处

少数派
少数派 · 2025-01-03T07:00:00Z
独享MRDIMM有多强?至强6性能核处理器的内存二三事

至强6处理器在核数和内存带宽上显著提升,推理性能增强,性价比提高。MRDIMM技术支持更高的内存带宽和容量,适合AI训练和大型数据库应用。CXL内存扩展进一步提升性能,降低推理成本。

独享MRDIMM有多强?至强6性能核处理器的内存二三事

机器之心
机器之心 · 2024-12-26T07:59:34Z

本文介绍了多种提高大型语言模型(LLMs)效率的新方法,包括SampleAttention、共享注意力、HiP、SparQ Attention和系统2关注(S2A)。这些方法通过优化注意力机制、降低时间和空间复杂度、减少内存带宽需求等手段,显著提升了模型的推理性能和准确性。

利用异构上下文分片在注意力头之间进行高效的 LLM 训练和服务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z
流量一样但为什么CPU使用率差别很大

文章讨论了两台性能相同的物理机在相同负载下CPU使用率差异很大的问题,原因是其中一台机器的内存带宽是另一台的两倍。作者建议通过绑核测试来确认问题。

流量一样但为什么CPU使用率差别很大

plantegg
plantegg · 2024-04-26T04:30:03Z

苹果M3 Pro的内存带宽比M1/M2 Pro少四分之一,苹果的内存选项变得复杂,消费者需谨慎选择。

苹果 M3 系列 MacBook Pro 的内存带宽和内存容量问题

苹果fans博客
苹果fans博客 · 2023-12-06T02:16:55Z

苹果发布M3系列芯片,性能更好,晶体管数量缩水,内存带宽150GB/S,M3 Max晶体管数量未超过M1 Ultra,每款M芯片发布时都会介绍晶体管数量,M3系列晶体管数量为250亿至920亿。

苹果M3系列芯片晶体管数量仍然没有突破 看起来确实是在挤牙膏?

蓝点网
蓝点网 · 2023-10-31T08:28:23Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码