Lei Mao's Log Book ·

PyTorch自定义操作

💡 原文英文，约2900词，阅读约需11分钟。

📝

内容提要

本文介绍了如何在PyTorch中实现自定义操作，包括使用C++和CUDA编写自定义函数和类。通过示例代码，展示了如何注册和使用这些自定义操作，确保它们在PyTorch模型和AOTInductor编译的推理程序中正常工作，并讨论了模型导出及推理验证。

🎯

❓

可以通过C++和CUDA实现自定义操作，包括自定义类和函数，并使用TORCH_LIBRARY_IMPL宏进行注册。

自定义操作可以通过torch.ops.load_library加载，并在PyTorch模型中调用。

需要注册“假”的自定义类和函数版本，以支持torch.export和torch.compile。

可以使用torch::CustomClassHolder定义自定义类，并通过TORCH_LIBRARY宏进行注册。

可以使用dlopen加载自定义操作库，无需pybind11或libpython依赖。

使用TORCH_LIBRARY_IMPL宏分别为CPU和CUDA实现注册自定义操作。

🏷️

2026年PyCon美国大会
微软和GitHub将在2026年5月14日至17日的PyCon US上展出，展示Pylance与Meta新型Pyrefly类型检查器的集成，并提供互动实验...
AlexHost拉斯维加斯机房上线：享15%上新优惠，6.8欧/月起无限流量+支持Windows
AlexHost在美国拉斯维加斯新开机房，提供15%优惠，起价6.8欧元/月，支持无限流量和Windows系统。机房使用Intel Xeon处理器和NVM...
AI 时代，软件大师们为什么都倒戈向 Go 和 Rust 了？
在AI时代，软件大师Eric S. Raymond和Uncle Bob Martin放弃了C和Java，转向Go和Rust。他们认为编程语言的选择标准已改...
查看YouTube 2026年Brandcast的最新消息。
在2026年的Brandcast上，我们分享了YouTube如何帮助品牌与观众在各个屏幕上连接的信息。
Fivetran首席产品官：封闭数据堆栈无法在代理时代生存
Fivetran首席产品官Anjan Kundavaram在《The New Stack》播客中强调了开放数据基础设施的重要性。他指出，虽然AI代理在数据...
微软Edge Copilot更新利用AI从所有标签页中提取信息
微软Edge浏览器新增Copilot AI功能，能够从所有打开的标签页中提取信息，用户可询问标签内容、比较产品和总结文章。新功能还包括AI学习模式、将标签...