Running hccl-test with Volcano

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

本文介绍了制作hccl-test镜像的步骤,包括下载依赖包、编写Dockerfile、安装Python和Ascend Toolkit等。然后详细说明了如何编译、推送和运行hccl-test镜像,并查看Pod状态。最后给出了清理环境的步骤。

🎯

关键要点

  • 制作 hccl-test 镜像的步骤包括下载依赖包、编写 Dockerfile、安装 Python 和 Ascend Toolkit。
  • 下载依赖包的链接包括 Python、Ascend Toolkit 和 mpich。
  • 编写 Dockerfile 的步骤包括安装基础库、Python 和 Ascend Toolkit。
  • 编译 hccl-test 镜像的命令为 docker build。
  • 推送 hccl-test 镜像的命令为 docker push。
  • 给测试节点打标签以便于创建 Volcano Job。
  • 创建 Volcano Job 的步骤包括设置环境变量和编写 Job 配置。
  • 运行 hccl-test 的步骤包括查看 Pod 状态和进入 Pod 进行测试。
  • 单机测试和多节点测试的环境变量设置和命令示例。
  • 清理环境的步骤。
➡️

继续阅读