The DigitalOcean Blog ·

迎接高性能、低成本推理的新标准：NVIDIA Dynamo 1.0现已向DigitalOcean客户开放

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

NVIDIA Dynamo 1.0在GTC发布，现已为DigitalOcean客户提供，推理性能提升7倍，成本降低。结合DigitalOcean的Agentic Inference Cloud，客户可高效部署，优化推理工作负载，支持GPU集群，提升吞吐量和降低延迟。

🎯

🔎

NVIDIA Dynamo 1.0的推出使得推理性能提升了7倍，同时降低了成本。这对于需要高效推理的企业来说，意味着可以在保持性能的同时，显著减少运营开支，提升整体竞争力。

Dynamo 1.0采用了KV感知路由和分离服务等技术，能够智能地分配GPU资源，减少延迟。这些技术的应用使得推理过程更加高效，尤其适合处理复杂的生成AI任务。

通过与DigitalOcean的Agentic Inference Cloud结合，Dynamo 1.0为用户提供了简单的部署方式和强大的性能优化。这种集成不仅提升了吞吐量，还降低了延迟，适合需要快速响应的应用场景。

❓

NVIDIA Dynamo 1.0是一个高性能推理服务框架，旨在加速和优化大规模生成AI和推理模型。

Dynamo 1.0通过KV感知路由、分离服务和内存卸载等技术，实现了最高7倍的推理性能提升。

DigitalOcean客户可以将Dynamo 1.0作为容器镜像运行在Droplet上，或直接在DigitalOcean Kubernetes上部署推理运行时。

例如，Workato使用Dynamo在DigitalOcean上实现了67%的吞吐量提升和79%的延迟降低。

Dynamo 1.0与DigitalOcean的Agentic Inference Cloud结合，客户可以高效部署并优化推理工作负载。

未来将推出更多产品更新，以增强DigitalOcean的Agentic Inference Cloud能力，包括新的AI-first数据中心和支持更多高性能模型。

🏷️