Lei Mao's Log Book ·

TensorRT 自定义插件示例

💡 原文英文，约5500词，阅读约需20分钟。

📝

内容提要

本文讨论了在TensorRT中实现和集成自定义插件的方法，并提供了一个具体示例。自定义插件用于加速在NVIDIA GPU上的深度学习推理，并允许用户为TensorRT不支持的神经网络层创建自定义插件。文章提供了创建自定义插件、实现插件类以及在TensorRT中注册插件的代码示例。还演示了如何使用自定义插件构建引擎并运行推理。

🎯

关键要点

TensorRT是一个高性能的深度学习推理SDK，支持用户为不支持的神经网络层创建自定义插件。
本文提供了如何在TensorRT中实现和集成自定义插件的具体示例。
创建了一个简单的身份ONNX模型，其中包含三个卷积节点，第二个节点被替换为自定义的IdentityConv节点。
自定义插件类需要从nvinfer1::IPluginV2IOExt或nvinfer1::IPluginV2DynamicExt类派生。
IdentityConv插件的enqueue方法被重写，以实现输入张量到输出张量的简单复制。
自定义插件创建者类需要从nvinfer1::IPluginCreator类派生，并实现createPlugin和deserializePlugin方法。
TensorRT允许静态和动态注册自定义插件，示例中使用动态注册方法。
自定义插件库可以通过nvinfer1::IPluginRegistry::loadLibrary方法动态加载。
自定义插件可以通过nvinfer1::IBuilderConfig::setPluginsToSerialize方法序列化到TensorRT引擎文件中。
在推理时，可以直接从引擎文件反序列化引擎，而无需加载自定义插件库。

🏷️

继续阅读

保护每一次 AI 调用的隐私安全 — 面向企业和个人的大模型安全接入网关
智链 AI 网关在统一代理转发大模型 API 的基础上，内置**数据脱敏、隐私保护、全链路审计**三大安全能力，确保敏感信息不泄露、每次调用可追溯。支持 ...
108_Pingu_企鹅家族_BQB
本文介绍了名为“108_Pingu_企鹅家族”的表情包库，并提供了永久更新的链接。
中国汽车的问题，除了新车太像，还有新车太多
38 万平方米的展馆面积、181 台首发新车、71 台首发概念车、212 场发布会。相较于两年前，这些数据都有了大幅增长。2026 年的北京车展，已经成为...
AI科研工具深度解析：Paperclip如何用arXiv重构论文检索分析方式
Paperclip通过整合arXiv等数据库，重构了AI论文检索方式，允许AI快速检索和分析论文，提升科研效率。AI能够直接处理全文，支持批量操作和跨领域...
开源Sandcastle项目实战：AI独自写889次代码更新全流程揭秘
Sandcastle项目展示了AI独立完成889次代码更新的能力，采用严格的流程设计，包括AI编写、检查和审核代码，人类仅负责最终确认。项目通过明确的任务...
AI数智时代：股票智能预测系统功能实战
本案例介绍了基于华为云码道的股票智能预测系统，利用Transformer算法和Tushare获取A股历史数据，预测未来5日价格。用户可通过可视化图表查看预...

TensorRT 自定义插件示例

内容提要

关键要点

标签

继续阅读