💡 原文中文,约1900字,阅读约需5分钟。
📝

内容提要

摩尔线程发布了Torch-MUSA v2.7.0,增强了PyTorch深度学习框架的功能和性能,支持统一内存设备,算子超过1050个。新版本集成muSolver和muFFT,加速复杂计算,新增动态双精度转换和分布式检查点功能,优化内存使用和计算效率,未来将持续跟进PyTorch更新。

🎯

关键要点

  • 摩尔线程发布了Torch-MUSA v2.7.0,增强了PyTorch深度学习框架的功能和性能。
  • 新版本支持统一内存设备,算子总数超过1050个。
  • 集成muSolver和muFFT,加速复杂计算任务的执行效率。
  • 新增动态双精度转换和分布式检查点功能,优化内存使用和计算效率。
  • 保持与最新MUSA SDK的兼容性,支持MUSA SDK 4.2.0至4.3.0及更高版本。
  • v2.7.0版本新增多个实用算子,进一步提升性能与稳定性。
  • 未来将持续跟进PyTorch更新,计划支持PyTorch 2.9.0,优化性能与功能。
➡️

继续阅读