PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持,新增功能和性能优化,包括对 Python 3.14 的支持及改进的调试功能。

🎯

关键要点

  • PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持。
  • 新增功能包括对 Python 3.14 的支持及改进的调试功能。
  • AMD ROCm 版本支持常规 GEMM 回退和 CK 实现分组 GEMM。
  • 改进了 Windows 上 PyTorch 对 ROCm 的支持,新增多个功能。
  • 对 Intel GPU 的支持得到多项改进,新增 Torch XPU API 和性能优化。
  • NVIDIA CUDA 支持包括模板内核、预编译内核支持和改进的 CUDA 兼容性。
  • Torch Inductor 中的 combo-kernels 水平融合降低了内核启动开销。

延伸问答

PyTorch 2.10 主要增强了哪些 GPU 的支持?

PyTorch 2.10 主要增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持。

PyTorch 2.10 新增了哪些功能?

新增功能包括对 Python 3.14 的支持及改进的调试功能。

AMD ROCm 版本在 PyTorch 2.10 中有哪些改进?

AMD ROCm 版本支持常规 GEMM 回退和 CK 实现分组 GEMM,并改进了 Windows 上的支持。

PyTorch 2.10 对 Intel GPU 的支持有哪些新特性?

新增了多个适用于 Intel GPU 的 Torch XPU API,支持 ATen 运算符和新的自定义运算符。

NVIDIA CUDA 在 PyTorch 2.10 中有哪些新功能?

NVIDIA CUDA 支持包括模板内核、预编译内核支持和改进的 CUDA 兼容性。

PyTorch 2.10 如何改进了调试功能?

PyTorch 2.10 改进了调试功能,并通过 combo-kernels 水平融合降低了内核启动开销。

➡️

继续阅读