标签

 nvidia 

相关的文章:

本列表汇集了关于 NVIDIA 在人工智能、机器人技术及其与各大企业合作的最新动态与研究成果,展示了其在推动技术进步方面的重要角色。

Inflection AI将其LLM推理堆栈从NVIDIA迁移至Intel Gaudi的经验教训

At Inflection AI, we recently made a major shift in our infrastructure: we ported our LLM inference stack from NVIDIA The post What Inflection AI Learned Porting Its LLM Inference Stack from...

Inflection AI将其LLM推理堆栈从NVIDIA GPU迁移至Intel Gaudi加速器,以应对GPU供应短缺和价格上涨。经过几周的调整和优化,性能接近NVIDIA。解决了不支持的操作和执行模式问题,提升了性能,并为未来硬件设计提供了经验。

Inflection AI将其LLM推理堆栈从NVIDIA迁移至Intel Gaudi的经验教训
原文英文,约800词,阅读约需3分钟。发表于:
阅读原文

NVIDIA Megatron-LM 存在双重注入风险:v0.12.1 版本修复代码执行漏洞

NVIDIA Megatron-LM高危漏洞可致远程代码执行,v0.12.1紧急修复。

NVIDIA 宣布其开源语言模型框架 Megatron-LM 存在两个高危漏洞(CVE-2025-23264 和 CVE-2025-23265),CVSS 评分为 7.8,可能导致远程代码执行和数据篡改。漏洞源于 Python 组件处理不当,影响 0.12.0 之前版本,已在 0.12.1 中修复。

原文中文,约900字,阅读约需2分钟。发表于:
阅读原文

HPE与NVIDIA推出AI工厂解决方案,助力下一次工业变革

To speed up AI adoption across industries, HPE and NVIDIA today launched new AI factory offerings at HPE Discover in Las Vegas. The new lineup includes everything from modular AI factory...

HPE与NVIDIA在拉斯维加斯推出新AI工厂解决方案,结合模块化基础设施和RTX PRO服务器,旨在加速企业AI的应用。该产品整合了NVIDIA Blackwell计算和网络技术,以及HPE的服务器,提供全面的AI平台,支持多行业应用。

HPE与NVIDIA推出AI工厂解决方案,助力下一次工业变革
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

Nvidia的RTX 5050 GPU起价249美元,配备上一代GDDR6显存

Nvidia has announced GeForce RTX 5050 GPUs for both desktops and laptops with support for ray tracing and DLSS 4 with Multi Frame Generation.  On the desktop side, the RTX 5050 will start at $249,...

Nvidia发布了GeForce RTX 5050 GPU,支持光线追踪和DLSS 4。桌面版起价249美元,功耗130W,配备8GB GDDR6显存;笔记本版功耗35W至100W,使用8GB GDDR7显存,起价999美元。RTX 5050在单人游戏中可实现高设置和150 fps表现。

Nvidia的RTX 5050 GPU起价249美元,配备上一代GDDR6显存
原文英文,约400词,阅读约需2分钟。发表于:
阅读原文

NVIDIA及合作伙伴在Automatica展现下一代机器人、自动化和人工智能技术

From the heart of Germany’s automotive sector to manufacturing hubs across France and Italy, Europe is embracing industrial AI and advanced AI-powered robotics to address labor shortages, boost...

欧洲通过工业AI和先进机器人技术应对劳动力短缺,提升生产力,推动可持续经济增长。NVIDIA推出支持工业应用的AI云和人形机器人模型,助力制造业发展。Automatica大会展示了多家公司的创新机器人和自动化解决方案,推动智能制造和物流发展。

NVIDIA及合作伙伴在Automatica展现下一代机器人、自动化和人工智能技术
原文英文,约1000词,阅读约需4分钟。发表于:
阅读原文

Spectro Cloud 利用 NVIDIA 堆栈为 AI 基础设施提供助力,实现电信和边缘扩展

Spectro Cloud 宣布将其 Palette 平台与 NVIDIA DOCA 3.0 和 NVIDIA AI Enterprise集成,以简化电信、企业和边缘环境中的 AI...

Spectro Cloud 宣布将 Palette 平台与 NVIDIA DOCA 3.0 和 AI Enterprise 集成,以简化电信和边缘环境中的 AI 部署,支持高级配置和实时威胁检测,提升网络效率,适用于可扩展的 AI 基础架构。

Spectro Cloud 利用 NVIDIA 堆栈为 AI 基础设施提供助力,实现电信和边缘扩展
原文中文,约600字,阅读约需2分钟。发表于:
阅读原文
原文英文,约1000词,阅读约需4分钟。发表于:
阅读原文

Hexagon利用NVIDIA机器人技术和人工智能软件开发并部署AEON新型人形机器人

As a global labor shortage leaves 50 million positions unfilled across industries like manufacturing and logistics, Hexagon — a global leader in measurement technologies — is developing humanoid...

Hexagon开发的AEON人形机器人旨在解决制造业和物流中的劳动力短缺问题,能够执行现实捕捉、资产检查和操作支持等工业任务,利用NVIDIA技术进行训练和优化。AEON将在汽车和航空等行业应用,推动数字双胞胎的普及,提高工作效率。

Hexagon利用NVIDIA机器人技术和人工智能软件开发并部署AEON新型人形机器人
原文英文,约900词,阅读约需4分钟。发表于:
阅读原文

NVIDIA与德电合作推进德国主权AI

Industrial AI isn’t slowing down. Germany is ready. Following London Tech Week and GTC Paris at VivaTech, NVIDIA founder and CEO Jensen Huang’s European tour continued with a stop in Germany to...

德国正在建设首个工业AI云,由德电运营,提供计算资源以加速企业AI应用。这将提升德国在智能机器人和AI基础设施方面的竞争力,预计AI千兆工厂将在2027年上线,进一步推动发展。

NVIDIA与德电合作推进德国主权AI
原文英文,约800词,阅读约需3分钟。发表于:
阅读原文

NVIDIA 研究人员在 Transformer LLM 中引入动态内存稀疏化 (DMS),实现 8× KV 缓存压缩

随着推理密集型任务需求的增长,大型语言模型 (LLM) 越来越有望生成更长的序列或并行推理链。然而,推理时间性能不仅受限于生成的令牌数量,还严重受限于键值 (KV) 缓存的内存占用...

动态内存稀疏化(DMS)是一种高效的键值缓存压缩方法,能够在不降低模型精度的情况下提升推理性能。研究表明,DMS在多个基准测试中表现优异,实现了8倍的KV缓存压缩,同时保持或提高了模型性能,适合资源受限环境。

NVIDIA 研究人员在 Transformer LLM 中引入动态内存稀疏化 (DMS),实现 8× KV 缓存压缩
原文中文,约1900字,阅读约需5分钟。发表于:
阅读原文