💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持,新增功能和性能优化,包括对 Python 3.14 的支持及改进的调试功能。

🎯

关键要点

  • PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持。
  • 新增功能包括对 Python 3.14 的支持及改进的调试功能。
  • AMD ROCm 版本支持常规 GEMM 回退和 CK 实现分组 GEMM。
  • 改进了 Windows 上 PyTorch 对 ROCm 的支持,新增多个功能。
  • 对 Intel GPU 的支持得到多项改进,新增 Torch XPU API 和性能优化。
  • NVIDIA CUDA 支持包括模板内核、预编译内核支持和改进的 CUDA 兼容性。
  • Torch Inductor 中的 combo-kernels 水平融合降低了内核启动开销。
➡️

继续阅读