NVIDIA Blog ·

天啊，这不是神话：NVIDIA Triton加速Oracle云上的推理

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

软件架构师Thomas Park选择了NVIDIA Triton Inference Server为Oracle Cloud Infrastructure的Vision AI服务设计了一个AI推理平台。Triton降低了OCI的总拥有成本10%，提高了预测吞吐量最多76%，并将推理延迟降低了最多51%。OCI Vision AI用于物体检测和图像分类，例如自动检测车辆轴以进行收费计算。Triton现在正在被其他OCI服务采用。OCI的数据科学服务计划使用户更容易接受Triton。

🎯

关键要点

软件架构师Thomas Park为Oracle Cloud Infrastructure的Vision AI服务设计了AI推理平台，选择了NVIDIA Triton Inference Server。
Triton降低了OCI的总拥有成本10%，提高了预测吞吐量最多76%，并将推理延迟降低了最多51%。
OCI Vision AI用于物体检测和图像分类，例如自动检测车辆轴以进行收费计算。
Triton现在正在被其他OCI服务采用，提升了用户体验。
OCI的数据科学服务为客户构建了一个Triton感知的AI平台，自动配置推理端点。
OCI的数据科学服务是NetSuite和Oracle Fusion SaaS应用的机器学习平台，服务于众多企业用户。
Triton被视为最佳推理框架，尤其在多模型推理方面表现出色。
Keisar的团队正在评估NVIDIA TensorRT-LLM软件，以加速复杂的大型语言模型推理。
Oracle正在部署最新的NVIDIA H100 Tensor Core GPUs等硬件，以推动加速努力。

🏷️

继续阅读

Nvidia推出DLSS 4.5更新，新增帧生成功能
Nvidia在beta应用更新中推出动态帧生成功能，类似于GPU的自动变速器，用户可在不同的多帧生成级别间自动切换，以平衡帧率、图像质量和响应速度。该功能...
编码团队标准
通过与高级工程师访谈，提取隐性知识，明确开发流程中的关键问题，形成指导原则。这些原则有助于识别架构决策、安全检查和常见错误，促进团队知识共享，提高代码审查的有效性。
从等级制度到智能化
文章探讨了组织结构的演变，强调AI在企业协作中的潜力。Block公司尝试用AI替代传统管理，建立基于实时数据的“世界模型”，提升信息流动和决策效率，从而更...
从硬派越野变为豪华旗舰，全新坦克 700 用上 Hi4-Z，预售 43.8 万元起
全新坦克700预售，提供Hi4-T和Hi4-Z两种动力系统，兼顾越野与城市通勤需求。设计灵感来自麒麟，配备先进智能驾驶系统，提升安全性与舒适度，旨在吸引更广泛的用户群体。
华为、宁德时代、高通齐聚！奇瑞捷豹路虎重启「神行者」，首款车型为 800V 增程
奇瑞捷豹路虎宣布常熟工厂将停产捷豹系列车型，推出全新独立品牌FREELANDER神行者，专注于新能源与智能化技术，强调豪华与实用性。首款概念车Concep...
2026年3月：油价、猝死与双人成行
女儿三年级，我回忆起1997年的经历，计划记录生活。三月油价因国际局势上涨，汽油进入“9元时代”。张雪峰猝死引发对生活的思考。生活中添了小刺猬，送走了鹦鹉...

天啊，这不是神话：NVIDIA Triton加速Oracle云上的推理

内容提要

关键要点

标签

继续阅读