海光 K100 DCU VLLM 推理环境构建

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

本文介绍了在Kylin OS上部署深度学习模型的环境配置,包括系统要求、驱动安装、模型下载和镜像选择等步骤。建议使用小模型进行测试,并提供相关命令和配置文件示例。

🎯

关键要点

  • 系统要求: Kylin OS, Hygon C86 7390 2S, 显存128G, 内存500G。
  • 基础驱动安装: 参考DTK环境安装与部署,执行相关命令测试驱动。
  • 模型文件下载: 可从HuggingFace或ModelScope下载离线模型,建议使用小模型进行测试。
  • 环境镜像: 国产加速卡需使用定制镜像,选择与DCU驱动版本相匹配的镜像。
  • 部署服务参数: 设置显卡槽、匹配K100架构、使用显卡数量和显卡使用率。
  • docker-compose.yml配置: 修改显卡数、模型路径和映射路径等内容。
  • 测试命令: 提供一些打印测试的命令,成功部署后可忽略。

延伸问答

在Kylin OS上部署深度学习模型需要什么系统要求?

需要Kylin OS、Hygon C86 7390 2S、显存128G和内存500G。

如何安装基础驱动以支持深度学习模型的部署?

参考DTK环境安装与部署,执行相关命令测试驱动。

可以从哪里下载深度学习模型文件?

可以从HuggingFace或ModelScope下载离线模型,建议使用小模型进行测试。

国产加速卡在环境镜像选择上有什么特别要求?

国产加速卡需使用定制镜像,选择与DCU驱动版本相匹配的镜像。

如何配置docker-compose.yml文件以部署服务?

需要修改显卡数、模型路径和映射路径等内容。

成功部署后有哪些测试命令可以使用?

提供一些打印测试的命令,成功部署后可忽略这些命令。

➡️

继续阅读