小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

美光计划将游戏GPU的GDDR显存进行堆叠,以满足AI数据中心对高内存的需求。这可能导致显存供应紧张和价格上涨。尽管GDDR内存性能低于HBM3,但堆叠后容量更大,AI行业愿意采用。这一变化可能会推高游戏显卡的价格。

美光探索将游戏GPU的GDDR显存堆叠起来组成大容量内存供应给AI数据中心

蓝点网
蓝点网 · 2026-04-01T01:00:17Z
一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

Google Research 发布的 TurboQuant AI 压缩算法能够在不损失性能的情况下,将 AI 的工作记忆压缩至少 6 倍,解决显存瓶颈问题。该技术引发市场反应,导致存储芯片股价下跌。尽管前景广阔,但仍需克服训练阶段的显存消耗问题。

一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

爱范儿
爱范儿 · 2026-03-26T05:41:43Z

本文介绍了大模型并发推理的显存计算方法,指出KV Cache是显存增长的主要因素。通过7B、32B和70B模型的示例,分析了不同并发数下的显存需求及推荐的GPU配置。建议采用张量并行和专家并行来优化显存使用,以满足系统内存和CPU核心数的需求。

大模型并发场景GPU显存资源计算

安志合的学习博客
安志合的学习博客 · 2026-03-20T02:30:06Z
传闻称英伟达正在准备9GB显存版的RTX 5050显卡 采用3颗GDDR7 3GB显存颗粒

英伟达正在研发9GB显存的RTX 5050显卡,配备3颗GDDR7 3GB内存,显存带宽提升至28Gbps,性能有所提高,预计价格也会更高。同时,英伟达还在开发RTX 5060改进版,使用GB205核心,性能低于RTX 5070。

传闻称英伟达正在准备9GB显存版的RTX 5050显卡 采用3颗GDDR7 3GB显存颗粒

蓝点网
蓝点网 · 2026-03-06T08:53:29Z
阿里巴巴发布Qwen3.5中型系列模型 量化版可在24GB内存/显存的上本地运行

阿里巴巴通义千问团队发布了Qwen3.5中型系列模型,强调以更小的参数实现更高的智能。新模型在基准测试中超越了旧版,支持在24GB内存设备上运行,适合个人和企业使用。

阿里巴巴发布Qwen3.5中型系列模型 量化版可在24GB内存/显存的上本地运行

蓝点网
蓝点网 · 2026-02-25T06:13:02Z

文章讨论了HP战99 Ultra笔记本在AI推理中的表现,搭载AMD AI Max+ 395处理器。分析了显存与统一内存的区别,并测试了不同模型的推理性能,指出显存分配的局限性。尽管性能不及高端显卡,但在特定场景下仍能运行一些模型,适合小主机使用。

可划分显存 != 统一内存:AI Max+ 395 64G AI推理性能

ddadaal.me
ddadaal.me · 2026-02-02T12:34:00Z
博板堂消息称AMD和英伟达显卡最早可能从1月开始涨价 接下来几个月可能还要继续涨

博板堂消息称,AMD将于2026年1月起涨价,英伟达在2月涨价。涨价由下游AIC制造商决定,因显存价格上涨,成本增加,预计显卡价格将持续上调。

博板堂消息称AMD和英伟达显卡最早可能从1月开始涨价 接下来几个月可能还要继续涨

蓝点网
蓝点网 · 2025-12-29T03:38:46Z
不同显寸对应的可运行的模型大小 - 蝈蝈俊

在有限显存下,运行大型语言模型需平衡模型规模、量化精度和上下文长度。显存需求受模型参数、上下文缓存和系统开销影响,增加上下文长度会迅速消耗显存。选择合适的量化格式可提升性能。

不同显寸对应的可运行的模型大小 - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-12-12T08:39:00Z
来看下我装备了5060TI显卡的gpt-oss模型表现

在3060笔记本上测试gpt-oss时,生成速度为4.66token/s。更换为5060TI后,速度提升至27.91token/s,效果更佳。显存加载显著影响性能,未来可尝试32B模型。

来看下我装备了5060TI显卡的gpt-oss模型表现

Nicksxs's Blog
Nicksxs's Blog · 2025-11-30T13:53:14Z

本文提供了NVIDIA GPU的参数速查表,涵盖Blackwell、Hopper和Ampere架构的算力、显存和带宽等详细信息,适用于AI和数据中心等领域。建议访问NVIDIA官网获取最新数据。

英伟达GPU参数速查表

安志合的学习博客
安志合的学习博客 · 2025-11-29T15:29:38Z
英伟达显卡涨价在即:英伟达停止在捆绑显存 要求AIC合作伙伴自行采购显存

英伟达停止捆绑销售显存,要求AIC厂商自行采购,可能导致显卡价格上涨,小型厂商面临采购压力,竞争力下降,消费者将承担更高成本。

英伟达显卡涨价在即:英伟达停止在捆绑显存 要求AIC合作伙伴自行采购显存

蓝点网
蓝点网 · 2025-11-28T01:55:49Z
软通华方超炫3700四卡液冷工作站,赋能教育应用新场景

软通华方推出3700四卡液冷工作站,具备1120T INT8推理算力和384GB显存,支持复杂AI任务。液冷技术降低噪音50%,提升能效,助力智慧教育发展。

软通华方超炫3700四卡液冷工作站,赋能教育应用新场景

全球TMT-美通国际
全球TMT-美通国际 · 2025-11-10T09:44:22Z
通过显卡来给gpt-oss做个加速

在MacBook Pro上使用gpt-oss因内存限制运行困难。在显存为6G的Windows笔记本上使用lm studio运行gpt-oss 20b模型,加载8层后生成速度有所提升,但仍受显存限制,建议使用显存大于16G的显卡。

通过显卡来给gpt-oss做个加速

Nicksxs's Blog
Nicksxs's Blog · 2025-09-21T13:58:37Z

中兴Mariana技术突破显存限制,提出高性能分布式KV索引,优化KV Cache存储,提升吞吐量和降低延迟,满足大模型推理需求。通过细粒度并发控制和自适应缓存策略,Mariana为CXL硬件生态奠定了基础,推动AI技术普及。

榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒

量子位
量子位 · 2025-08-26T05:52:59Z

DeepSeek-V3.1采用UE8MO FP8参数精度,显著提升AI模型训练效率,降低显存占用,支持国产芯片发展,助力应对技术封锁。

DeepSeek采用的UE8M0 FP8 为什么引爆了A股的芯片板块 - 张善友

张善友
张善友 · 2025-08-24T10:55:00Z
Nvidia的RTX 5050 GPU起价249美元,配备上一代GDDR6显存

Nvidia发布了GeForce RTX 5050 GPU,支持光线追踪和DLSS 4。桌面版起价249美元,功耗130W,配备8GB GDDR6显存;笔记本版功耗35W至100W,使用8GB GDDR7显存,起价999美元。RTX 5050在单人游戏中可实现高设置和150 fps表现。

Nvidia的RTX 5050 GPU起价249美元,配备上一代GDDR6显存

The Verge
The Verge · 2025-06-24T15:45:49Z
【小记】分布式训练中进程崩溃 SIGSEGV

在多卡训练中,进程因SIGSEGV(段错误)崩溃,导致训练失败。常见原因包括不可序列化对象、内存不足和NCCL通信问题。建议检查GPU显存、共享内存及CUDA与NCCL的兼容性。调整CUDA和NCCL版本,使用gloo模式可暂时解决问题,但效率较低,优先使用NCCL。

【小记】分布式训练中进程崩溃 SIGSEGV

Anjhon’s Blog
Anjhon’s Blog · 2025-06-16T16:00:00Z

R-KV是一种开源方法,通过实时压缩KV缓存,解决大模型推理中的冗余问题,显存减少90%,吞吐量提升6.6倍,准确率保持100%。该方法通过冗余识别、重要性评估和动态淘汰优化推理过程,适用于边缘设备和强化学习,显著提升性能。

10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题

量子位
量子位 · 2025-06-16T08:33:37Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

机器之心
机器之心 · 2025-06-11T02:15:34Z
英特尔面向人工智能平台推出双芯片48GB显存的B60显卡 单个系统可组成192GB显存

英特尔推出B60双芯片显卡,配备48GB显存,支持最多192GB,兼容传统工作站,采用鼓风散热设计,但带宽有限。每个芯片功耗240W~300W,售价接近1000美元。相比之下,英伟达显卡性能更强,软件生态更成熟。

英特尔面向人工智能平台推出双芯片48GB显存的B60显卡 单个系统可组成192GB显存

蓝点网
蓝点网 · 2025-05-26T06:43:32Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码