在昇腾平台上对TensorFlow网络进行性能调优

💡 原文中文,约3200字,阅读约需8分钟。
📝

内容提要

本文介绍了在昇腾平台上对TensorFlow训练网络进行性能调优的常用手段,包括自动混合精度、亲和接口替换、训练迭代循环下沉以及AOE自动调优等,可以在昇腾文档中心、社区在线课程板块学习视频课程,并在昇腾论坛互动交流。

🎯

关键要点

  • 本文介绍了在昇腾平台上对TensorFlow训练网络进行性能调优的常用手段。
  • 性能调优的全流程包括使能自动混合精度、亲和接口替换、训练迭代循环下沉和AOE自动调优。
  • 基本调优操作完成后需再次评估性能,若未达标则需使用Profling工具进行进阶调优。
  • 使能自动混合精度可通过配置'precision_mode'参数来实现,提升训练性能。
  • 亲和接口替换建议使用Ascend提供的API实现,以获得更优性能。
  • 训练迭代循环下沉通过减少Host与Device间的交互次数来缩短训练时长。
  • AOE自动调优工具可进行子图调优、算子调优与梯度调优,生成最优调度策略。
  • 用户可在昇腾文档中心和社区在线课程学习更多相关内容,并在论坛交流。
➡️

继续阅读