NVIDIA Blog ·

快速、低成本的推理是实现盈利AI的关键

💡 原文英文，约2400词，阅读约需9分钟。

📝

内容提要

NVIDIA的推理平台通过NIM微服务、Triton推理服务器和TensorRT库提升了AI推理性能，简化模型部署并优化性能。与主要云服务提供商的合作确保了云端部署的无缝性，推动了AI服务的普及，提高了用户体验和业务效率。

🎯

关键要点

NVIDIA推理平台通过NIM微服务、Triton推理服务器和TensorRT库提升AI推理性能，节省了零售、电信等行业的成本。
NVIDIA的推理软件优化和Hopper平台帮助行业提供最新的生成AI模型，提升用户体验并优化总拥有成本。
AI推理需要在吞吐量和用户体验之间取得平衡，目标是以更低的成本生成更多的令牌。
NVIDIA技术简化模型部署，同时优化AI推理工作负载的成本和性能，提供灵活性和可定制性。
NVIDIA NIM微服务、Triton推理服务器和TensorRT库是满足用户需求的推理解决方案。
NVIDIA与主要云服务提供商合作，确保推理平台在云端的无缝部署，支持多种云服务。
Perplexity AI利用NVIDIA H100 GPU和Triton推理服务器处理每月超过4.35亿个查询，显著降低成本。
Docusign通过NVIDIA推理平台优化其智能协议管理平台，提高了生产力和客户体验。
Amdocs利用NVIDIA NIM减少数据预处理和推理中的令牌消耗，提升用户体验。
Snap通过NVIDIA Triton整合推理服务平台，显著减少开发时间和成本，提升用户体验。
Wealthsimple通过NVIDIA推理平台将模型交付时间从几个月缩短到15分钟，实现99.999%的正常运行时间。
Let’s Enhance利用NVIDIA推理平台优化创意工作流程，提升产品照片的视觉效果。
Oracle Cloud Infrastructure通过集成NVIDIA Triton提升预测吞吐量和减少延迟，改善客户体验。
微软利用NVIDIA推理解决方案提升Bing搜索的性能，显著降低延迟和成本。
NVIDIA GPU在AI推理工作负载中提供高效能和能效，推动AI模型的进步。
未来的AI推理将通过NVIDIA软件、创新技术和先进硬件实现性能和成本的显著提升。

❓

延伸问答

NVIDIA推理平台的主要组成部分是什么？

NVIDIA推理平台主要由NIM微服务、Triton推理服务器和TensorRT库组成。

NVIDIA推理平台如何帮助降低企业成本？

NVIDIA推理平台通过优化推理性能和简化模型部署，帮助企业在零售和电信等行业节省成本。

NVIDIA与云服务提供商的合作有什么重要性？

NVIDIA与主要云服务提供商的合作确保了推理平台在云端的无缝部署，支持多种云服务。

Perplexity AI是如何利用NVIDIA技术处理查询的？

Perplexity AI使用NVIDIA H100 GPU和Triton推理服务器处理每月超过4.35亿个查询，显著降低成本。

Docusign如何通过NVIDIA推理平台提升客户体验？

Docusign通过NVIDIA推理平台优化其智能协议管理平台，提高了生产力和客户体验。

未来的AI推理将如何发展？

未来的AI推理将通过NVIDIA软件、创新技术和先进硬件实现性能和成本的显著提升。

🏷️

继续阅读

SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
SuperX将在Interop Tokyo 2026发布1.6T光模块解决方案
SuperX将在2026年Interop Tokyo发布1.6T光模块解决方案，专为大规模AI训练与推理设计，支持数字信号处理和硅光技术。展会将展示多种A...
【Rust日报】2026-06-05 NVIDIA OpenShell：AI Agent 的安全私有运行时
NVIDIA 开源了 OpenShell，一个为 AI Agent 设计的安全沙箱运行时，防止未授权访问和数据泄露。每个 Agent 在独立容器中运行，支...
Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
忆联中标中国移动SSD AVAP项目，总容量第一
忆联中标中国移动SSD AVAP项目，成为第一成交候选人，获得总容量第一。中标产品包括UH8系列PCIe Gen5 SSD和UM3系列SATA eSSD，...