飞桨硬件接入方案升级,CUDA兼容类硬件后端Kernel复用可达92.6%

💡 原文中文,约5600字,阅读约需14分钟。
📝

内容提要

飞桨框架3.0推出了多硬件统一适配方案,降低了硬件适配成本,支持即插即用接入。该方案通过插件架构和标准接口,简化接入流程,提升模型训练和推理性能,降低开发门槛,促进硬件生态落地。

🎯

关键要点

  • 飞桨框架3.0推出多硬件统一适配方案,降低硬件适配成本。
  • 该方案采用插件架构和标准接口,简化接入流程,提升模型训练和推理性能。
  • 接口抽象层革新,适配接口数减少56%,适配代码量减少80%。
  • 插件式架构设计实现即插即用的硬件接入模式,简化接入流程。
  • 提供多元化接入方式,涵盖算子开发、算子映射、图接入等。
  • 与芯片厂商建立协同创新模式,保障技术演进和质量根基。
  • 3.1版本推出插件式CUDA兼容类硬件接入方案,支持高效复用CUDA算子实现。
  • 类CUDA兼容方案降低适配成本,初次适配仅需464行代码开发。
  • Kernel复用率最高可达92.6%,大幅降低开发门槛。
  • 持续同步迭代提升迭代效率,框架与硬件后端解耦。
  • 后续将持续优化插件式CUDA兼容类硬件接入方案,扩展单测和编译器链路。
  • 即将举行闭门会,解答开发者对CUDA兼容类硬件的疑问。
➡️

继续阅读