NVIDIA Blog ·

点燃未来：TensorRT-LLM发布加速AI推理性能，支持在RTX驱动的Windows 11电脑上运行新模型

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

具有人工智能功能的Windows 11电脑正在革新用户体验。NVIDIA RTX技术和微软的优化帮助开发者更快地创建人工智能应用。适用于Windows的TensorRT-LLM将兼容OpenAI的Chat API，使RTX电脑上可以本地运行项目。AI Workbench允许开发者定制预训练的生成式AI模型。DirectML的增强和即将发布的TensorRT-LLM将提高推理性能并支持更多的LLM。NVIDIA为Windows启用TensorRT-LLM，提供与OpenAI的ChatAPI类似的API接口，加速RTX电脑上的AI开发和部署。

🎯

关键要点

具有人工智能功能的Windows 11电脑正在革新用户体验。
NVIDIA RTX技术帮助开发者更快地创建人工智能应用。
TensorRT-LLM将兼容OpenAI的Chat API，使RTX电脑上可以本地运行项目。
AI Workbench允许开发者定制预训练的生成式AI模型。
DirectML的增强将提高推理性能并支持更多的LLM。
TensorRT-LLM将加速RTX电脑上的AI开发和部署。
TensorRT-LLM即将发布的新版本将提高推理性能并支持更多流行的LLM。
NVIDIA将为Windows启用TensorRT-LLM，提供与OpenAI ChatAPI类似的API接口。
开发者可以在本地运行AI项目，保护私密数据。
AI Workbench提供统一的工具包，简化生成式AI模型的创建和测试。
NVIDIA和微软将发布DirectML增强，支持Llama 2和Stable Diffusion。
TensorRT-LLM的最新版本将支持更多流行的LLM，提升本地AI能力。
开发者可以利用开源项目和资源，推动生成式AI在Windows上的应用。
NVIDIA和微软致力于加速Llama在RTX上的性能，简化跨供应商部署。
新优化和资源将加速AI功能和应用的开发与部署。

🏷️

点燃未来：TensorRT-LLM发布加速AI推理性能，支持在RTX驱动的Windows 11电脑上运行新模型

内容提要

关键要点

标签

继续阅读