小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
超越移植:vLLM如何在AMD ROCm上协调高性能推理

处理部分构建KV缓存请求的额外提示侧令牌,关注缓存上下文与新输入,属于混合工作负载。在线服务中,调度程序利用此阶段将长提示工作分解,并与其他请求的解码交错,以提高延迟和吞吐量的整体平衡。

超越移植:vLLM如何在AMD ROCm上协调高性能推理

vLLM Blog
vLLM Blog · 2026-02-27T00:00:00Z
RCCLX:在AMD平台上创新GPU通信

Meta开源了RCCLX,这是RCCL的增强版,旨在加速AI模型创新。新特性包括直接数据访问(DDA)和低精度集体通信,显著提升AMD平台性能。DDA减少延迟,低精度集体优化通信开销,支持FP32和BF16数据类型,并与Torchcomms集成,简化跨平台通信。

RCCLX:在AMD平台上创新GPU通信

Engineering at Meta
Engineering at Meta · 2026-02-24T21:30:54Z

初创公司Taalas推出新芯片HC1,速度可达每秒17000个token,成本仅为传统芯片的1/10。该芯片通过将模型直接刻在硅片上,提升了性能和效率。团队由AMD前高管组成,专注于AI推理和训练的创新架构。尽管HC1表现优异,但硬编码可能导致过时的风险。

24人团队硬刚英伟达!AMD前高管梦之队出手,新芯片每秒17000个token

量子位
量子位 · 2026-02-21T06:31:56Z
扩展我们的智能推理云:推出基于AMD Instinct™ MI350X GPU的新型Droplets

DigitalOcean推出基于AMD Instinct™ MI350X GPU的新型高性能Droplets,专为复杂推理工作负载设计,支持大规模模型训练和高效推理,具备低延迟和高吞吐量。客户ACE Studio已应用该技术于音乐创作。新Droplets已在亚特兰大数据中心上线,未来将推出液冷的MI355X GPU。

扩展我们的智能推理云:推出基于AMD Instinct™ MI350X GPU的新型Droplets

The DigitalOcean Blog
The DigitalOcean Blog · 2026-02-19T12:30:00Z

李飞飞创办的World Labs获得10亿美元融资,估值达50亿美元。该公司专注于“空间智能”和“世界模型”,吸引了AMD、英伟达等投资者。李飞飞指出,空间智能是AI的下一个前沿,旨在让AI理解并参与物理世界。

AMD英伟达都投了!李飞飞创业公司官宣10亿新融资

量子位
量子位 · 2026-02-19T04:49:30Z

千问3.5开源发布,推动全球AI产业发展。英伟达、华为等已适配该模型,其性能超越前代,显存占用减少60%。因其高性价比和开源特性,成为热门选择,多个平台已上线服务。

千问3.5引爆全球AI产业链,英伟达、华为昇腾、AMD、苹果等第一时间适配

量子位
量子位 · 2026-02-18T10:22:01Z
AMD 视频解码现已统一于 RadeonSI 和 RADV Vulkan 视频之间

Mesa 26.1-devel 版本合并了 RadeonSI 和 RADV 驱动程序的视频解码统一实现,提升了 AMD 视频加速支持,使 RADV Vulkan 视频可在旧款 Hawaii GPU 上运行,减少了约1400行代码,预计第二季度正式发布。

AMD 视频解码现已统一于 RadeonSI 和 RADV Vulkan 视频之间

实时互动网
实时互动网 · 2026-02-13T02:18:56Z
AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南 - 程序设计实验室

本文介绍了如何在Windows + AMD显卡 + ROCm环境下,通过StabilityMatrix快速部署ComfyUI,实现AI绘图。ComfyUI支持可视化工作流,用户可通过模板快速上手。正确配置启动参数可避免性能问题,AMD显卡的AI生态逐渐完善,用户体验良好。

AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-07T15:15:00Z

#硬件设备 华擎就 AMD RYZEN 9000 系列处理器烧毁问题发布声明,称将与 AMD 合作检查问题。此前华硕和微星也发布类似声明,出现 CPU 烧毁的案例整体来说还是比较少的,目前无法确定是不是主板制造商激进的电源策略引起的问题。查看全文:https://ourl.co/111769

华擎就AMD RYZEN 9000系列处理器烧毁问题发布声明 将与AMD合作检查问题

蓝点网
蓝点网 · 2026-02-06T08:50:46Z
告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别 - 程序设计实验室

本文介绍了在Windows系统和AMD显卡上成功编译ROCm版本的PyTorch,并通过MNIST手写数字识别脚本验证其性能。文章讲解了神经网络的基本概念,比较了前馈神经网络(FNN)与卷积神经网络(CNN)的区别,强调了CNN在图像处理中的优势。最后,展示了如何安装PyTorch、定义模型、准备数据并进行训练,成功实现了在AMD GPU上的训练过程。

告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-06T07:54:00Z
Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 程序设计实验室

作者在 Windows 11 上成功编译了 ROCm 版的 PyTorch,使用了官方 ROCm 软件包和较旧的 PyTorch 2.9.1 版本,避免了许多问题,并安装了相关库以进行深度学习和 AI 画图实验。

Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-06T07:53:00Z
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 程序设计实验室

本文记录了作者在Windows 11上使用AMD RX 6650 XT显卡、ROCm和PyTorch进行AI绘图的尝试,尽管遇到多次编译错误,作者计划持续更新,直至成功或放弃。

Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 程序设计实验室

程序设计实验室
程序设计实验室 · 2026-02-05T08:47:00Z
燧原科技,腾讯供养的中国AMD

在人工智能时代,百度、阿里和腾讯(BAT)加大对AI芯片的投资。燧原科技计划在科创板上市,募资60亿元,创始团队有AMD背景,腾讯是其最大股东和客户,提供资金和订单支持。燧原科技专注于专用芯片设计,但面临国产企业的竞争挑战。

燧原科技,腾讯供养的中国AMD

TechWeb 全站精华
TechWeb 全站精华 · 2026-02-05T03:01:11Z
AMD暗示微软可能在2027年推出下一代Xbox

微软与AMD合作开发2027年发布的下一代Xbox主机,进展顺利,支持高端混合型体验。

AMD暗示微软可能在2027年推出下一代Xbox

The Verge
The Verge · 2026-02-03T23:22:37Z
沐曦股份估值神话背后:“中国AMD”攻坚国产替代

国产GPU迅速崛起,沐曦股份成为最赚钱新股,创始团队背景深厚。尽管面临亏损,沐曦凭借强大技术团队和资本支持,专注于AI算力芯片,未来发展潜力巨大。

沐曦股份估值神话背后:“中国AMD”攻坚国产替代

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-29T02:59:19Z
技嘉聚焦三大关键产品线与AMD深化合作

技嘉科技与AMD深化合作,推出AI电竞笔记本、X870E X3D主板和高刷新率OLED显示器,提升游戏性能。AORUS MASTER 16搭载AMD Ryzen 9 9955HX3D处理器,GIGABYTE AERO X16使用AMD Ryzen AI 400系列处理器,显示器支持AMD FreeSync Premium Pro认证,确保流畅游戏体验。

技嘉聚焦三大关键产品线与AMD深化合作

全球TMT-美通国际
全球TMT-美通国际 · 2026-01-29T02:14:02Z
Costco高端AMD游戏台式机优惠数百美元

由于RAM价格上涨,许多人考虑购买预装台式机。Costco推出一款售价1999.99美元(会员优惠300美元)的高端游戏电脑,配置包括Ryzen 9 9950X3D处理器、Radeon 9070 XT显卡、32GB DDR5内存和2TB SSD,性价比高。

Costco高端AMD游戏台式机优惠数百美元

The Verge
The Verge · 2026-01-26T16:00:53Z
AMD将从1月29日开始发售9850X3D处理器 售价499美元 较9800X3D贵30美元

AMD将于2026年1月29日发布RYZEN 7 9850X3D处理器,售价499美元。该处理器是9800X3D的优化版,频率提升至5.6GHz,采用ZEN 5架构,具备更好的导热效率和超频能力。性能提升有限,建议玩家根据需求选择。

AMD将从1月29日开始发售9850X3D处理器 售价499美元 较9800X3D贵30美元

蓝点网
蓝点网 · 2026-01-26T07:20:33Z

AMD Zen 5 CPU在性能上取得突破,支持AVX-512指令,提升了SIMD编程效率。使用纯Rust编写的SIMD代码可显著提升性能,适用于多平台。Servo浏览器引擎新增多窗口和代理支持,并改进了开发者工具和Web功能。

【Rust日报】2026-01-22 AMD Zen 5 的性能突破 & SIMD 编程在纯 Rust 中的应用

Rust.cc
Rust.cc · 2026-01-25T04:50:57Z
在AMD GPU上构建混合模型与vLLM-SR

我们正在构建混合模型(MoM)系统,以提升大型语言模型(LLM)的集体智能。核心问题包括捕捉请求与响应信号、优化模型协作和确保系统安全。通过vLLM语义路由器,我们展示了在AMD GPU上实时路由查询的能力,支持多种模型和信号类型。MoM架构通过智能调度和能力匹配,实现高效的AI部署。

在AMD GPU上构建混合模型与vLLM-SR

vLLM Blog
vLLM Blog · 2026-01-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码