Running hccl-test with Volcano
💡
原文英文,约800词,阅读约需3分钟。
📝
内容提要
本文介绍了制作hccl-test镜像的步骤,包括下载依赖包、编写Dockerfile、安装Python和Ascend Toolkit等。然后详细说明了如何编译、推送和运行hccl-test镜像,并查看Pod状态。最后给出了清理环境的步骤。
🎯
关键要点
- 制作 hccl-test 镜像的步骤包括下载依赖包、编写 Dockerfile、安装 Python 和 Ascend Toolkit。
- 下载依赖包的链接包括 Python、Ascend Toolkit 和 mpich。
- 编写 Dockerfile 的步骤包括安装基础库、Python 和 Ascend Toolkit。
- 编译 hccl-test 镜像的命令为 docker build。
- 推送 hccl-test 镜像的命令为 docker push。
- 给测试节点打标签以便于创建 Volcano Job。
- 创建 Volcano Job 的步骤包括设置环境变量和编写 Job 配置。
- 运行 hccl-test 的步骤包括查看 Pod 状态和进入 Pod 进行测试。
- 单机测试和多节点测试的环境变量设置和命令示例。
- 清理环境的步骤。
➡️