小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
超越移植:vLLM如何在AMD ROCm上协调高性能推理

处理部分构建KV缓存请求的额外提示侧令牌,关注缓存上下文与新输入,属于混合工作负载。在线服务中,调度程序利用此阶段将长提示工作分解,并与其他请求的解码交错,以提高延迟和吞吐量的整体平衡。

超越移植:vLLM如何在AMD ROCm上协调高性能推理

vLLM Blog
vLLM Blog · 2026-02-27T00:00:00Z
RCCLX:在AMD平台上创新GPU通信

Meta开源了RCCLX,这是RCCL的增强版,旨在加速AI模型创新。新特性包括直接数据访问(DDA)和低精度集体通信,显著提升AMD平台性能。DDA减少延迟,低精度集体优化通信开销,支持FP32和BF16数据类型,并与Torchcomms集成,简化跨平台通信。

RCCLX:在AMD平台上创新GPU通信

Engineering at Meta
Engineering at Meta · 2026-02-24T21:30:54Z

初创公司Taalas推出新芯片HC1,速度可达每秒17000个token,成本仅为传统芯片的1/10。该芯片通过将模型直接刻在硅片上,提升了性能和效率。团队由AMD前高管组成,专注于AI推理和训练的创新架构。尽管HC1表现优异,但硬编码可能导致过时的风险。

24人团队硬刚英伟达!AMD前高管梦之队出手,新芯片每秒17000个token

量子位
量子位 · 2026-02-21T06:31:56Z
扩展我们的智能推理云:推出基于AMD Instinct™ MI350X GPU的新型Droplets

DigitalOcean推出基于AMD Instinct™ MI350X GPU的新型高性能Droplets,专为复杂推理工作负载设计,支持大规模模型训练和高效推理,具备低延迟和高吞吐量。客户ACE Studio已应用该技术于音乐创作。新Droplets已在亚特兰大数据中心上线,未来将推出液冷的MI355X GPU。

扩展我们的智能推理云:推出基于AMD Instinct™ MI350X GPU的新型Droplets

The DigitalOcean Blog
The DigitalOcean Blog · 2026-02-19T12:30:00Z

李飞飞创办的World Labs获得10亿美元融资,估值达50亿美元。该公司专注于“空间智能”和“世界模型”,吸引了AMD、英伟达等投资者。李飞飞指出,空间智能是AI的下一个前沿,旨在让AI理解并参与物理世界。

AMD英伟达都投了!李飞飞创业公司官宣10亿新融资

量子位
量子位 · 2026-02-19T04:49:30Z

千问3.5开源发布,推动全球AI产业发展。英伟达、华为等已适配该模型,其性能超越前代,显存占用减少60%。因其高性价比和开源特性,成为热门选择,多个平台已上线服务。

千问3.5引爆全球AI产业链,英伟达、华为昇腾、AMD、苹果等第一时间适配

量子位
量子位 · 2026-02-18T10:22:01Z
AMD 视频解码现已统一于 RadeonSI 和 RADV Vulkan 视频之间

Mesa 26.1-devel 版本合并了 RadeonSI 和 RADV 驱动程序的视频解码统一实现,提升了 AMD 视频加速支持,使 RADV Vulkan 视频可在旧款 Hawaii GPU 上运行,减少了约1400行代码,预计第二季度正式发布。

AMD 视频解码现已统一于 RadeonSI 和 RADV Vulkan 视频之间

实时互动网
实时互动网 · 2026-02-13T02:18:56Z
AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南 - 程序设计实验室

本文介绍了如何在Windows + AMD显卡 + ROCm环境下,通过StabilityMatrix快速部署ComfyUI,实现AI绘图。ComfyUI支持可视化工作流,用户可通过模板快速上手。正确配置启动参数可避免性能问题,AMD显卡的AI生态逐渐完善,用户体验良好。

AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-07T15:15:00Z

#硬件设备 华擎就 AMD RYZEN 9000 系列处理器烧毁问题发布声明,称将与 AMD 合作检查问题。此前华硕和微星也发布类似声明,出现 CPU 烧毁的案例整体来说还是比较少的,目前无法确定是不是主板制造商激进的电源策略引起的问题。查看全文:https://ourl.co/111769

华擎就AMD RYZEN 9000系列处理器烧毁问题发布声明 将与AMD合作检查问题

蓝点网
蓝点网 · 2026-02-06T08:50:46Z
告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别 - 程序设计实验室

本文介绍了在Windows系统和AMD显卡上成功编译ROCm版本的PyTorch,并通过MNIST手写数字识别脚本验证其性能。文章讲解了神经网络的基本概念,比较了前馈神经网络(FNN)与卷积神经网络(CNN)的区别,强调了CNN在图像处理中的优势。最后,展示了如何安装PyTorch、定义模型、准备数据并进行训练,成功实现了在AMD GPU上的训练过程。

告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-06T07:54:00Z
Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 程序设计实验室

作者在 Windows 11 上成功编译了 ROCm 版的 PyTorch,使用了官方 ROCm 软件包和较旧的 PyTorch 2.9.1 版本,避免了许多问题,并安装了相关库以进行深度学习和 AI 画图实验。

Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-06T07:53:00Z
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 程序设计实验室

本文记录了作者在Windows 11上使用AMD RX 6650 XT显卡、ROCm和PyTorch进行AI绘图的尝试,尽管遇到多次编译错误,作者计划持续更新,直至成功或放弃。

Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-05T08:47:00Z
燧原科技,腾讯供养的中国AMD

在人工智能时代,百度、阿里和腾讯(BAT)加大对AI芯片的投资。燧原科技计划在科创板上市,募资60亿元,创始团队有AMD背景,腾讯是其最大股东和客户,提供资金和订单支持。燧原科技专注于专用芯片设计,但面临国产企业的竞争挑战。

燧原科技,腾讯供养的中国AMD

TechWeb 全站精华
TechWeb 全站精华 · 2026-02-05T03:01:11Z
AMD暗示微软可能在2027年推出下一代Xbox

微软与AMD合作开发2027年发布的下一代Xbox主机,进展顺利,支持高端混合型体验。

AMD暗示微软可能在2027年推出下一代Xbox

The Verge
The Verge · 2026-02-03T23:22:37Z
沐曦股份估值神话背后:“中国AMD”攻坚国产替代

国产GPU迅速崛起,沐曦股份成为最赚钱新股,创始团队背景深厚。尽管面临亏损,沐曦凭借强大技术团队和资本支持,专注于AI算力芯片,未来发展潜力巨大。

沐曦股份估值神话背后:“中国AMD”攻坚国产替代

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-29T02:59:19Z
技嘉聚焦三大关键产品线与AMD深化合作

技嘉科技与AMD深化合作,推出AI电竞笔记本、X870E X3D主板和高刷新率OLED显示器,提升游戏性能。AORUS MASTER 16搭载AMD Ryzen 9 9955HX3D处理器,GIGABYTE AERO X16使用AMD Ryzen AI 400系列处理器,显示器支持AMD FreeSync Premium Pro认证,确保流畅游戏体验。

技嘉聚焦三大关键产品线与AMD深化合作

全球TMT-美通国际
全球TMT-美通国际 · 2026-01-29T02:14:02Z
Costco高端AMD游戏台式机优惠数百美元

由于RAM价格上涨,许多人考虑购买预装台式机。Costco推出一款售价1999.99美元(会员优惠300美元)的高端游戏电脑,配置包括Ryzen 9 9950X3D处理器、Radeon 9070 XT显卡、32GB DDR5内存和2TB SSD,性价比高。

Costco高端AMD游戏台式机优惠数百美元

The Verge
The Verge · 2026-01-26T16:00:53Z
AMD将从1月29日开始发售9850X3D处理器 售价499美元 较9800X3D贵30美元

AMD将于2026年1月29日发布RYZEN 7 9850X3D处理器,售价499美元。该处理器是9800X3D的优化版,频率提升至5.6GHz,采用ZEN 5架构,具备更好的导热效率和超频能力。性能提升有限,建议玩家根据需求选择。

AMD将从1月29日开始发售9850X3D处理器 售价499美元 较9800X3D贵30美元

蓝点网
蓝点网 · 2026-01-26T07:20:33Z

AMD Zen 5 CPU在性能上取得突破,支持AVX-512指令,提升了SIMD编程效率。使用纯Rust编写的SIMD代码可显著提升性能,适用于多平台。Servo浏览器引擎新增多窗口和代理支持,并改进了开发者工具和Web功能。

【Rust日报】2026-01-22 AMD Zen 5 的性能突破 & SIMD 编程在纯 Rust 中的应用

Rust.cc
Rust.cc · 2026-01-25T04:50:57Z
在AMD GPU上构建混合模型与vLLM-SR

我们正在构建混合模型(MoM)系统,以提升大型语言模型(LLM)的集体智能。核心问题包括捕捉请求与响应信号、优化模型协作和确保系统安全。通过vLLM语义路由器,我们展示了在AMD GPU上实时路由查询的能力,支持多种模型和信号类型。MoM架构通过智能调度和能力匹配,实现高效的AI部署。

在AMD GPU上构建混合模型与vLLM-SR

vLLM Blog
vLLM Blog · 2026-01-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码