NVIDIA Blog ·

释放巅峰性能：TensorRT加速RTX PC和工作站上的AI

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

本文介绍了NVIDIA TensorRT软件开发工具包的优化，使其能够在RTX GPU上实现高性能生成式人工智能。TensorRT加速可在新的UL Procyon AI Image Generation基准测试中进行测试，测试结果显示与非TensorRT实现相比，GeForce RTX 4080 SUPER GPU的速度提升了50%。TensorRT还提供了更高效和精确的AI体验，性能通常是其他框架的两倍。此外，TensorRT还加速了Stable Video Diffusion等流行的生成式AI模型，提供了40%的加速。TensorRT还支持ControlNets，用户可以通过添加其他图像作为引导来控制生成式输出。TensorRT还在其他应用程序中实现了加速，如DaVinci Resolve和Topaz Labs的AI工具。通过在本地运行生成式AI，用户可以获得更低的延迟、节省成本、随时访问功能和数据隐私保护。

🎯

关键要点

NVIDIA TensorRT软件开发工具包优化了生成式人工智能在RTX GPU上的性能。
在UL Procyon AI图像生成基准测试中，GeForce RTX 4080 SUPER GPU的速度提升了50%。
TensorRT提供更高效和精确的AI体验，性能通常是其他框架的两倍。
TensorRT加速了流行的生成式AI模型，如Stable Video Diffusion，提供40%的加速。
TensorRT支持ControlNets，用户可以通过添加其他图像来控制生成式输出。
TensorRT还加速了DaVinci Resolve和Topaz Labs等应用程序的AI工具。
本地运行生成式AI可降低延迟、节省成本、随时访问功能和保护数据隐私。
TensorRT-LLM是一个开源库，优化了最新大语言模型的推理。
TensorRT-LLM支持流行的社区模型，方便开发者和用户实验。
NVIDIA与开源社区合作，开发TensorRT-LLM与流行应用框架的连接器。

❓

延伸问答

TensorRT如何提升生成式人工智能的性能？

TensorRT通过优化在RTX GPU上的运行，通常使AI性能提高到其他框架的两倍。

在UL Procyon基准测试中，GeForce RTX 4080 SUPER GPU的表现如何？

在UL Procyon基准测试中，GeForce RTX 4080 SUPER GPU的速度提升了50%。

TensorRT支持哪些流行的生成式AI模型？

TensorRT加速了Stable Diffusion和Stable Video Diffusion等流行的生成式AI模型。

使用TensorRT的ControlNets有什么优势？

ControlNets允许用户通过添加其他图像来控制生成式输出，提供更高的灵活性和精确度。

TensorRT如何影响本地运行生成式AI的成本和隐私？

本地运行生成式AI可以降低云服务成本，并保护用户的私人数据不被上传到云端。

TensorRT-LLM是什么，它的主要功能是什么？

TensorRT-LLM是一个开源库，优化了最新大语言模型的推理，支持流行的社区模型。

🏷️