💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持,新增功能和性能优化,包括对 Python 3.14 的支持及改进的调试功能。
🎯
关键要点
- PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持。
- 新增功能包括对 Python 3.14 的支持及改进的调试功能。
- AMD ROCm 版本支持常规 GEMM 回退和 CK 实现分组 GEMM。
- 改进了 Windows 上 PyTorch 对 ROCm 的支持,新增多个功能。
- 对 Intel GPU 的支持得到多项改进,新增 Torch XPU API 和性能优化。
- NVIDIA CUDA 支持包括模板内核、预编译内核支持和改进的 CUDA 兼容性。
- Torch Inductor 中的 combo-kernels 水平融合降低了内核启动开销。
❓
延伸问答
PyTorch 2.10 主要增强了哪些 GPU 的支持?
PyTorch 2.10 主要增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持。
PyTorch 2.10 新增了哪些功能?
新增功能包括对 Python 3.14 的支持及改进的调试功能。
AMD ROCm 版本在 PyTorch 2.10 中有哪些改进?
AMD ROCm 版本支持常规 GEMM 回退和 CK 实现分组 GEMM,并改进了 Windows 上的支持。
PyTorch 2.10 对 Intel GPU 的支持有哪些新特性?
新增了多个适用于 Intel GPU 的 Torch XPU API,支持 ATen 运算符和新的自定义运算符。
NVIDIA CUDA 在 PyTorch 2.10 中有哪些新功能?
NVIDIA CUDA 支持包括模板内核、预编译内核支持和改进的 CUDA 兼容性。
PyTorch 2.10 如何改进了调试功能?
PyTorch 2.10 改进了调试功能,并通过 combo-kernels 水平融合降低了内核启动开销。
➡️