小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
在AMD GPU上构建混合模型与vLLM-SR

我们正在构建混合模型(MoM)系统,以提升大型语言模型(LLM)的集体智能。核心问题包括捕捉请求与响应信号、优化模型协作和确保系统安全。通过vLLM语义路由器,我们展示了在AMD GPU上实时路由查询的能力,支持多种模型和信号类型。MoM架构通过智能调度和能力匹配,实现高效的AI部署。

在AMD GPU上构建混合模型与vLLM-SR

vLLM Blog
vLLM Blog · 2026-01-23T00:00:00Z

AMD GPU 导致桌面频繁死机,确认是 Panel Self Refresh (PSR) 功能的已知 bug。通过修改内核参数并重启系统,成功禁用 PSR,问题得到解决,笔记本恢复稳定。

记录一次 AMD GPU 导致的桌面卡死及修复方式

Andy Stewart
Andy Stewart · 2026-01-22T16:00:00Z
摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

摩尔线程开源了TorchCodec-MUSA,实现了PyTorch编解码库的硬件适配,支持无缝迁移至国产GPU,提升视频处理效率,简化开发流程,降低使用门槛,推动国产GPU在AI训练中的应用。

摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

实时互动网
实时互动网 · 2026-01-22T06:12:48Z
PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持,新增功能和性能优化,包括对 Python 3.14 的支持及改进的调试功能。

PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

实时互动网
实时互动网 · 2026-01-22T02:12:20Z

本文介绍了如何将CUDA与Go语言结合,以实现高性能计算。通过Sam Burns的演讲,展示了GPU在并行计算中的优势,特别是在矩阵乘法示例中,强调了Go语言处理大规模数据的潜力。

当 Go 遇上 GPU:用 CUDA 释放千倍算力的实战指南

Tony Bai
Tony Bai · 2026-01-20T23:31:17Z
在Kubernetes中使用调度插件回收闲置的GPU资源

高端GPU成本高且常常闲置,Kubernetes调度未考虑实际利用率。为此,开发了ReclaimIdleResource插件,通过GPU利用率进行预占,优化资源管理。

在Kubernetes中使用调度插件回收闲置的GPU资源

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-01-20T12:00:00Z
为什么AI需要GPU和TPU:大型语言模型背后的硬件

Granola是一款AI笔记工具,帮助用户在会议中保持专注,将对话转化为实际进展。它支持生成任务、搜索项目对话和创建自定义提示,适用于多种会议应用。文章还讨论了GPU和TPU在现代大语言模型中的重要性,强调并行计算和内存带宽对AI性能的影响。

为什么AI需要GPU和TPU:大型语言模型背后的硬件

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-01-19T16:30:29Z

Oracle Java团队成员分享了他们的最新动态和观点。

使用Babylon和HAT优化Java中的GPU程序

insidejava
insidejava · 2026-01-19T00:00:00Z
摩尔线程开源MUSA加速版MONAI 1.5.0,国产全功能GPU赋能AI医学影像

摩尔线程开源MUSA加速版MONAI 1.5.0,专注于AI医学影像,提升国产算力。MONAI框架连接学术与临床,已下载350万次。MUSA软件栈优化性能,推动医学AI应用与国产生态发展。

摩尔线程开源MUSA加速版MONAI 1.5.0,国产全功能GPU赋能AI医学影像

实时互动网
实时互动网 · 2026-01-16T10:17:28Z
如何为您的AI工作负载选择最佳GPU

选择适合AI工作负载的GPU并不复杂,但需与具体需求匹配。训练模型需强大内存和带宽,而推理则侧重效率。合理选择和租用GPU,以避免不必要的开支。

如何为您的AI工作负载选择最佳GPU

freeCodeCamp.org
freeCodeCamp.org · 2026-01-15T17:08:09Z

芯桥半导体成立不到一年,推出Sinexus系列国产GPU,专注于AI应用,推动国产算力从“可用”到“易用”,并通过全生命周期服务解决行业痛点,助力制造、医疗、教育等领域的智能化转型。

国产GPU又杀出一匹黑马!成立不到一年,两款芯片量产落地

量子位
量子位 · 2026-01-15T09:22:12Z
使用 Karpenter 和 HAMi 实现 GPU 分片和动态扩缩容

现代AI和机器学习中的GPU资源管理面临挑战。结合Karpenter和HAMi可实现GPU资源的细粒度分片和动态扩缩容,从而提高资源利用率,降低成本,适用于AI训练和科学计算等场景。

使用 Karpenter 和 HAMi 实现 GPU 分片和动态扩缩容

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-01-14T02:49:01Z
模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

一位Mojo社区成员利用AI在Mojo中解决了量化挑战,其速度比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者使用。

模块化:如何在没有GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-14T00:00:00Z
模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

我参加了一个量化挑战,使用Mojo编程,结果比C++/CUDA实现快1.07到1.84倍。Mojo简化了GPU编程,适合开发者尝试。

模块化:我如何在没有任何GPU经验的情况下,使用Mojo击败Unsloth的CUDA内核

Modular Blog
Modular Blog · 2026-01-12T00:00:00Z

通过提供类型安全的 API、自动资源管理和完善的异常处理,TensorRtSharp 让 C# 开发者能够充分发挥 GPU 的计算能力,而无需面对复杂的原生代码。项目示例使用了四张图片进行同时推理,开启并行处理后,四张图像预处理时间仅用21ms,推理时间为25ms,后处理时间为26ms,累计时间为72ms.通过 P/Invoke 技术,它将 TensorRT 的原生 C++ API...

TensorRtSharp:在 C# 世界中释放 GPU 推理的极致性能

dotNET跨平台
dotNET跨平台 · 2026-01-11T00:01:18Z
Mesa 26.0 现在支持使用 Intel Xe 内核驱动程序的 GPU 硬件回放功能

Intel Mesa 26.0 将支持 Xe 驱动程序的 GPU 硬件重放功能,以加快问题的重现和调试。该功能依赖于新的内核补丁,预计稳定版将在 2 月发布。

Mesa 26.0 现在支持使用 Intel Xe 内核驱动程序的 GPU 硬件回放功能

实时互动网
实时互动网 · 2026-01-09T02:05:27Z
MSI微星的新款电源将能够监测GPU每路电压变化 电压异常时将发出警报防止GPU熔毁

MSI 微星推出新电源,具备电流异常监测功能,实时监控 GPU 供电线电压,异常时发出警报并强制黑屏以降低负载,防止硬件损坏,旨在降低 GPU 电源异常的安全风险。

MSI微星的新款电源将能够监测GPU每路电压变化 电压异常时将发出警报防止GPU熔毁

蓝点网
蓝点网 · 2026-01-08T07:00:53Z

黄仁勋在CES 2026上表示,未来机器人将承担人类不愿做的工作,并预计今年将出现具有人类水平的机器人。他强调自动驾驶技术的开放性与合作,英伟达将继续推动AI基础设施建设,以满足日益增长的内存需求。

黄仁勋CES回应全场!内存卡GPU脖子,游戏玩家可能只能用旧显卡了

量子位
量子位 · 2026-01-08T05:50:30Z
Tensor Fusion - 一种开源的GPU虚拟化和资源池解决方案,旨在提升集群利用率...

Tensor Fusion是一种针对GPU集群的虚拟化和资源池解决方案,旨在提升集群利用率和降低推理延迟。它支持动态GPU池、低延迟推理、自动扩展和调度,适合高推理密度和多租户环境,有效处理多模型和多租户工作负载。

Tensor Fusion - 一种开源的GPU虚拟化和资源池解决方案,旨在提升集群利用率...

云原生
云原生 · 2026-01-06T10:34:15Z
AMD发布基于2纳米工艺的ZEN 6威尼斯处理器和适用于AI领域的MI455X GPU加速卡

AMD发布基于台积电2纳米工艺的EPYC ZEN 6处理器和MI455X加速卡,ZEN 6的IPC预计提升15%至20%,MI455X则专为AI优化。Helios AI超算平台整合CPU与GPU,支持ROCm开放软件栈,旨在提高AI应用开发效率。

AMD发布基于2纳米工艺的ZEN 6威尼斯处理器和适用于AI领域的MI455X GPU加速卡

蓝点网
蓝点网 · 2026-01-06T06:07:43Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码