NVIDIA Blog ·

Hugging Face为开发者提供由NVIDIA NIM驱动的推理即服务

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

一项新服务将AI模型的令牌效率提高了5倍，使开发人员能够立即访问在NVIDIA DGX Cloud上运行的NIM微服务。该服务帮助开发人员快速部署大型语言模型，并通过NVIDIA NIM微服务进行优化。推理服务帮助开发人员在Hugging Face Hub上快速原型设计和部署到生产环境中。企业Hub用户可以利用无服务器推理提高灵活性、减少基础设施开销，并通过NVIDIA NIM实现优化性能。这些工具为Hugging Face开发人员提供了在NVIDIA加速基础设施上实验、测试和部署尖端模型的新方法。

🎯

关键要点

新服务将AI模型的令牌效率提高了5倍，开发人员可以立即访问在NVIDIA DGX Cloud上运行的NIM微服务。
Hugging Face平台的400万开发者可以轻松访问NVIDIA加速的推理服务，快速部署大型语言模型。
该服务支持开发人员快速原型设计开源AI模型，并将其部署到生产环境中。
企业Hub用户可以利用无服务器推理提高灵活性，减少基础设施开销，并优化性能。
推理服务与Hugging Face上的AI训练服务相辅相成，提供新的实验和部署方式。
NVIDIA NIM是一系列优化推理的AI微服务，提供更高的令牌处理效率。
NIM微服务提高了NVIDIA DGX Cloud基础设施的效率，加快了AI应用的速度。
NVIDIA DGX Cloud平台专为生成式AI设计，提供可扩展的GPU资源，支持AI开发的每个步骤。
Hugging Face推理服务使用户能够在企业级环境中实验最新的AI模型。
在SIGGRAPH上，NVIDIA还介绍了用于OpenUSD框架的生成式AI模型和NIM微服务。

❓

延伸问答

Hugging Face的新推理服务有什么优势？

该服务将AI模型的令牌效率提高了5倍，帮助开发者快速部署大型语言模型，并优化性能。

NVIDIA NIM微服务是什么？

NVIDIA NIM是一系列优化推理的AI微服务，提供更高的令牌处理效率。

如何在Hugging Face上使用推理服务？

用户可以通过Hugging Face的“Train”和“Deploy”下拉菜单轻松访问推理服务，快速原型设计和部署模型。

NVIDIA DGX Cloud平台的特点是什么？

NVIDIA DGX Cloud专为生成式AI设计，提供可扩展的GPU资源，支持AI开发的每个步骤。

企业Hub用户如何利用无服务器推理？

企业Hub用户可以通过无服务器推理提高灵活性，减少基础设施开销，并优化性能。

Hugging Face推理服务与训练服务有什么关系？

推理服务与Hugging Face上的AI训练服务相辅相成，提供新的实验和部署方式。

🏷️

继续阅读

Seedance MCP 对接指南
Seedance MCP 是由 Anthropic 推出的模型上下文协议，允许 AI 模型通过标准化接口调用外部工具。用户可以通过 AceData Clo...
微软在Build大会发布七款MAI新模型：顶尖MAI-Thinking-1深度拆解
微软在Build大会上发布了七款新AI模型，特别是MAI-Thinking-1，展示了其完整的AI产业链。通过自研MAIA芯片和大量人类数据训练，微软实现...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
AI对话开发服务怎么选?预算多少合适
AI对话产品的开发成本因服务模式、功能复杂度和交互形态而异。主要有三种服务模式：全包定制开发、成熟SaaS平台和基于API自建。预算应涵盖人力、技术服务、...