小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
迎接高性能、低成本推理的新标准:NVIDIA Dynamo 1.0现已向DigitalOcean客户开放

NVIDIA Dynamo 1.0在GTC发布,现已为DigitalOcean客户提供,推理性能提升7倍,成本降低。结合DigitalOcean的Agentic Inference Cloud,客户可高效部署,优化推理工作负载,支持GPU集群,提升吞吐量和降低延迟。

迎接高性能、低成本推理的新标准:NVIDIA Dynamo 1.0现已向DigitalOcean客户开放

The DigitalOcean Blog
The DigitalOcean Blog · 2026-03-19T22:13:37Z
NVIDIA Dynamo Planner为多节点大语言模型推理带来基于SLO的自动化

微软与NVIDIA推出Dynamo第二部分,旨在提升Azure Kubernetes Service上大语言模型的推理效率。新功能包括自动资源规划和动态扩展,帮助开发者快速配置GPU资源。Dynamo Planner Profiler与基于SLO的Dynamo Planner协同优化GPU分配,以满足流量变化下的服务水平目标。

NVIDIA Dynamo Planner为多节点大语言模型推理带来基于SLO的自动化

InfoQ
InfoQ · 2026-01-31T09:00:00Z
NVIDIA Dynamo 解决多节点大语言模型推理挑战

Dynamo是一个开源框架,旨在高效管理大语言模型(LLM)的分布式推理。它将推理过程分为预填充和解码阶段,动态调配GPU资源,以应对需求波动,支持多种推理引擎,并能在Kubernetes上运行高性能AI工作负载,优化资源使用,降低延迟。

NVIDIA Dynamo 解决多节点大语言模型推理挑战

InfoQ
InfoQ · 2025-12-04T13:00:00Z
智思:新的NVIDIA Dynamo集成简化数据中心规模的AI推理

NVIDIA Dynamo通过与主要云服务提供商的集成及Kubernetes管理能力,支持企业进行多节点推理,提升性能与效率。其分离服务技术优化AI模型推理,在GPU集群中实现高效管理,帮助企业降低成本并加速推理服务。

智思:新的NVIDIA Dynamo集成简化数据中心规模的AI推理

NVIDIA Blog
NVIDIA Blog · 2025-11-13T16:00:58Z
S3是如何提供近乎无限的存储和性能的?

AWS S3存储超过350万亿对象,数据量达10-100艾字节。其采用键值存储系统,性能优于传统文件系统。通过Dynamo技术分离元数据与文件内容,提升存取效率。S3架构基于微服务,支持每秒超过100万请求,确保高可用性和扩展性。

S3是如何提供近乎无限的存储和性能的?

DEV Community
DEV Community · 2025-04-06T12:12:51Z
NVIDIA GTC 2025:开启AI超级时代

2025年3月19日,NVIDIA在加州圣荷西举行GTC 2025,CEO黄仁勋进行了2.5小时的演讲,探讨了AI的未来,包括生成AI、代理AI和物理AI的演变,以及新发布的Dynamo操作系统和Blackwell Ultra超级芯片。此外,NVIDIA展示了自主驾驶解决方案Halos,强调AI技术的快速进步,预示AI将成为更智能的助手和创作伙伴。

NVIDIA GTC 2025:开启AI超级时代

DEV Community
DEV Community · 2025-03-24T01:43:20Z
构建类似Dynamo的键值数据库 - 第1部分 - TCP服务器

本文介绍了构建类似Dynamo的键值数据库的第二部分,重点在于通过TCP暴露API供客户端使用。设计要求包括可读性、简洁性和可扩展性。实现中定义了消息结构以支持请求跟踪,并通过解析消息构建命令(如Ping)。客户端发送Ping请求后,数据库返回'PONG'响应。

构建类似Dynamo的键值数据库 - 第1部分 - TCP服务器

DEV Community
DEV Community · 2024-11-12T20:13:44Z

文章讨论了Dynamo到DynamoDB的演变,强调了提供可管理服务的目标,以及在各个规模下实现快速和可预测性能的重要性。

DynamoDB 论文

Scramblings
Scramblings · 2022-10-18T11:30:00Z

最近在研究分布式的存储架构,具有性的设计有亚马逊的dynamo,LinkIn的voldemort等等,在查阅资料的时候深感他们的不便,特计划翻译其中的设计内容,为中文资料添加一份力量。 目前收集到的需要翻译的资料有: http://project-voldemort.com/design.php voldemort设计文档...

[我是陈版]分布式存储系统文档翻译计划-voldemort,lightCloud,dynamo

Blog on 54 CHEN
Blog on 54 CHEN · 2009-08-22T16:00:00Z

原文地址:http://project-voldemort.com/design.php 翻译:陈臻 http://www.54chen.com 我是陈科学院 版本:1.0 日期:2009-8-25 Key-Value存储 为了实现高性能和高可用性,我们只允许非常简单的键值数据存取。key和value可以是list和map的复杂类型,但美中不足的是只有以下的查询是有效的: value...

LinkIn基于Dynamo设计的系统:伏地魔(voldemort)设计中文文档[我是陈科学院译]-完稿

Blog on 54 CHEN
Blog on 54 CHEN · 2009-08-22T16:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码