小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
迅策科技公告牵手三大国产GPU厂商,近期股价已从高点腰斩

深圳迅策科技与沐曦集成电路、天数智芯半导体及壁仞科技签署战略合作协议,聚焦“算力+数据”融合,推动智能制造等领域的应用。这一合作标志着公司在“软硬一体”方向的重要进展,旨在加速企业级AI的规模化应用。股价因公告上涨,年内表现强劲。

迅策科技公告牵手三大国产GPU厂商,近期股价已从高点腰斩

TechWeb 全站精华
TechWeb 全站精华 · 2026-06-15T09:01:00Z
摩尔线程MusaCoder开源:首个基于国产全功能GPU全栈训练的代码大模型,性能比肩国际SOTA

摩尔线程发布了开源大模型MusaCoder,专为GPU底层算子生成设计,支持从PyTorch自动生成高性能CUDA/MUSA代码,提升开发效率。MusaCoder在KernelBench评测中表现优异,超越多款主流模型。其全链路训练依托国产MTT S5000集群,验证了国产GPU的强大能力,推动GPU编程和AI技术的创新与应用。

摩尔线程MusaCoder开源:首个基于国产全功能GPU全栈训练的代码大模型,性能比肩国际SOTA

实时互动网
实时互动网 · 2026-06-10T09:59:05Z
英特尔锐炫™ Pro B70 GPU亮相MPTS2026,共探大视听时代AI创作新范式

英特尔锐炫™ Pro B70 GPU在成都研讨会上发布,旨在提升AI创作效率。该显卡配备32GB显存,支持本地AI模型部署,确保数据安全,适用于影视制作和AI训练等复杂任务。联想与英特尔合作推出AI工作站,以满足高校教学需求,推动AI时代的内容创作与实践教学发展。

英特尔锐炫™ Pro B70 GPU亮相MPTS2026,共探大视听时代AI创作新范式

量子位
量子位 · 2026-06-10T07:27:58Z
Vortex 3.0 发布:一款全栈开源 RISC-V GPU,现已支持 3D 流水线

佐治亚理工学院发布了 Vortex 3.0,这是一个兼容 OpenCL 的 RISC-V GPGPU 设计。新版本引入了固定功能的图形堆栈、张量核心结构化稀疏性和线程束组级矩阵乘法等新特性,并支持 Mesa/Lavapipe Vulkan 后端。

Vortex 3.0 发布:一款全栈开源 RISC-V GPU,现已支持 3D 流水线

实时互动网
实时互动网 · 2026-06-10T02:06:59Z
通过Babylon从Java中利用GPU张量核心

本文介绍了Oracle Java团队提出的一种扩展HAT编程模型的方法,包含显式张量核心编程的API,旨在使其通用,以便在没有显式张量指令的加速器上处理通过HAT张量核心API表达的计算。

通过Babylon从Java中利用GPU张量核心

insidejava
insidejava · 2026-06-10T00:00:00Z
通过Babylon从Java中利用GPU张量核心

本文介绍了Oracle Java团队通过API扩展HAT编程模型,实现显式张量核心编程的方法,并展示了如何在没有显式张量指令的加速器上处理使用HAT张量核心API表达的计算。

通过Babylon从Java中利用GPU张量核心

insidejava
insidejava · 2026-06-10T00:00:00Z
从GPU到令牌:AI基础设施的8层可观察性架构

GPU利用率并不是最终目标,关键指标是令牌成本。近年来,AI基础设施中的GPU调度成为热门话题,旨在提高GPU利用效率。随着企业开始运行生产级大型语言模型服务,新的现象也随之出现。

从GPU到令牌:AI基础设施的8层可观察性架构

云原生
云原生 · 2026-06-09T03:31:16Z

本文讨论了面向异构硬件的代码生成,重点介绍了MLIR的GPU方言及其与传统GPU编程模型的区别。MLIR通过显式表示GPU编程概念,优化了内存层次和并行模型,涵盖了GPU的核心操作、内存映射、tiling策略及SPIR-V出口路径,强调了MLIR在AI编译链中的重要性,并与Triton和IREE进行了对比。

【编译器工程与 MLIR】面向异构硬件的代码生成

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-06-09T00:00:00Z
英伟达统一内存架构解析:WinPC也拥有苹果M芯片超能力

本文探讨了英伟达的“统一内存”架构,旨在合并CPU和GPU的内存,以提升性能和简化数据传输。文章分析了传统分离架构的局限性,强调统一内存在AI和游戏应用中的优势,同时指出其在内存类型选择和市场策略上的挑战。

英伟达统一内存架构解析:WinPC也拥有苹果M芯片超能力

极道
极道 · 2026-06-07T10:18:00Z

标普道琼斯指数拒绝将SpaceX快速纳入,影响了未盈利的AI公司如OpenAI和Anthropic。谷歌与SpaceX签订合同,每月支付9.2亿美元租用GPU,以满足AI需求。此外,GrapheneOS用户因使用该系统被Yoti上报,引发了隐私讨论。

2026 06 07 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2026-06-07T00:19:56Z
谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

谷歌与SpaceX达成合作,谷歌每月支付9.2亿美元使用SpaceX孟菲斯数据中心的11万台英伟达GPU,合作期为2026年10月至2029年6月。同时,SpaceX还与Anthropic合作,每月支付12.5亿美元使用22万台GPU。此举旨在提升SpaceX的AI业务,尽管其AI部门目前仍面临亏损和市场份额低的问题。

谷歌与SpaceX达成3年AI算力合作 谷歌将每月支付9.2亿美元使用孟菲斯C1数据中心

蓝点网
蓝点网 · 2026-06-06T04:58:00Z

推荐系统中的稀疏特征用于建模用户偏好和物品特性,但存在输入数据长度不一和内存浪费的问题。TorchRec的KeyedJaggedTensor通过合并稀疏特征来提高效率。使用时应注意GPU同步,建议在CPU上构建KeyedJaggedTensor后再转移至GPU,以提升性能。

与TorchRec KeyedJaggedTensor的同步

Lei Mao's Log Book
Lei Mao's Log Book · 2026-06-05T07:00:00Z
字节Agent自主优化GPU内核:挑战英伟达CUDA护城河

字节跳动开发的AI CUDA Agent能够自主优化CUDA代码,其性能超越人类专家40%。该AI通过强化学习快速发现传统编译器无法识别的优化技巧,可能会加剧硬件市场竞争,推动显卡选择不再受限于CUDA。

字节Agent自主优化GPU内核:挑战英伟达CUDA护城河

极道
极道 · 2026-06-03T22:12:00Z
在 Amazon EKS 上使用 NVIDIA GPU Operator 管理自定义 GPU 驱动与 CUDA 工作负载

在Amazon EKS上,使用NVIDIA GPU Operator可以有效管理自定义GPU驱动和CUDA工作负载。EKS通过EC2节点支持GPU工作负载,GPU Operator简化了驱动的安装和管理,确保容器的稳定运行。选择EKS托管节点组可以降低运维负担。同时,结合Kiro和AWS MCP,平台团队能够通过自然语言进行集群巡检和问题排查,从而提升运维效率。

在 Amazon EKS 上使用 NVIDIA GPU Operator 管理自定义 GPU 驱动与 CUDA 工作负载

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-03T09:22:40Z
跑大模型,最贵的不是 GPU,是这个东西

Llama-70B模型在处理128K token请求时,KV Cache占用429GB显存,成为推理成本的主要因素。通过TurboQuant、PD拆分和LMCache等技术,可以将长上下文推理成本降低4到40倍。这些技术的应用将显著提升效率,改善产品体验,推动LLM的广泛使用。

跑大模型,最贵的不是 GPU,是这个东西

迷途小书童
迷途小书童 · 2026-06-01T13:45:20Z
英特尔首款手持游戏芯片为Arc G3,Acer将率先使用

英特尔推出了首款手持游戏芯片Arc G3,Acer Predator Atlas 8将率先使用。该芯片具备强大的GPU核心,支持新游戏的驱动更新。Atlas 8配备24GB内存和高分辨率屏幕,预计将于10月上市,价格较高。

英特尔首款手持游戏芯片为Arc G3,Acer将率先使用

The Verge
The Verge · 2026-05-28T13:00:00Z
基于 KEDA 的 Kubernetes GPU 自动扩展:构建外部扩展器

KEDA 通过自定义 DaemonSet 解决 Kubernetes 中 GPU 工作负载的自动扩展问题。它利用 NVIDIA 管理库 (NVML) 收集 GPU 指标,如利用率、内存和功耗,并通过 gRPC 提供给 KEDA 操作员,从而实现基于 GPU 性能的自动扩展。这种方法提高了资源利用率,降低了能耗,适用于多种 GPU 工作负载。

基于 KEDA 的 Kubernetes GPU 自动扩展:构建外部扩展器

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-05-27T11:00:00Z

Joseph Stein discusses engineering an enterprise AI-as-a-Service platform within a private cloud data center. He explains how to maximize underutilized GPU pools via multi-namespace scheduling,...

Presentation: Realtime and Batch Processing of GPU Workloads

InfoQ
InfoQ · 2026-05-26T09:08:00Z
悄悄用 Go 重写 AI 基础设施:NVIDIA 的 GPU 云平台为何选择 Go?

NVIDIA 正在用 Go 语言重写其 AI 基础设施,包括 GPU 云函数平台 NVCF、AI 集群运行时 AICR 和分布式存储 AIStore。Go 语言因其高并发处理能力和云原生生态的兼容性,在这些项目中发挥核心作用。NVCF 管理 GPU 加速工作负载,AICR 简化 GPU 集群配置,AIStore 则为 AI 应用提供分布式存储解决方案。

悄悄用 Go 重写 AI 基础设施:NVIDIA 的 GPU 云平台为何选择 Go?

Tony Bai
Tony Bai · 2026-05-25T23:52:42Z
英伟达Vera Rubin直接指挥硬盘:内存变HBM加HBF加SSD三层结构

英伟达计划通过Vera Rubin架构实现GPU直接管理存储,形成HBM、HBF和SSD三层内存结构。这将提升AI服务器性能,减轻CPU负担,闪存厂商将受益。HBF适合存储不常修改的模型参数,未来可能改变内存市场格局。预计2026年开始商业化。

英伟达Vera Rubin直接指挥硬盘:内存变HBM加HBF加SSD三层结构

极道
极道 · 2026-05-25T03:05:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码