李文举 ·

tensorrt处理动态shape

💡 原文中文，约5800字，阅读约需14分钟。

📝

内容提要

本文介绍了在TensorRT中处理动态形状的方法，强调在导出ONNX模型时需指定动态维度。建议使用显式批处理模式和优化配置以提升性能，并提供了设置输入形状和构建引擎的示例代码。

🎯

🔎

在使用TensorRT处理动态形状时，确保在导出ONNX模型时正确指定动态维度至关重要。若未声明动态shape，可能导致在解析ONNX时出现错误，影响模型的正常运行。

TensorRT的显式批处理模式是支持动态形状的推荐方式。与隐式批处理模式相比，显式模式允许所有维度动态变化，提供更大的灵活性和性能优化空间。

在构建TensorRT引擎时，使用优化配置可以显著提升性能。通过指定输入形状的最小、最大和优化值，TensorRT能够生成更高效的引擎，适应不同的输入需求。

❓

在导出ONNX模型时，需要在dynamic_axes参数中指定动态shape的维度，例如将batch_size设置为动态维度。

TensorRT的动态shape支持经历了从implicit batch模式到explicit batch模式的演进，当前推荐使用explicit batch模式。

优化配置用于指定输入维度的取值范围，以帮助生成性能更好的engine，可以通过创建optimization profile来实现。

在构建TensorRT引擎时，可以使用builder.create_optimization_profile()创建优化配置，并设置输入的最小、最大和优化形状。

在使用TensorRT时，可以通过context.set_binding_shape()方法指定实际的shape，并通过context.active_optimization_profile选择使用的profile。

torch2trt_dynamic是一个工具，可以在简单场景下简化TensorRT对动态shape的支持，适合快速实现。

🏷️