The New Stack ·

教程：使用Nvkind Kubernetes搭建云原生GPU测试环境

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

本文介绍了如何在Docker上安装和配置nvkind，以支持GPU的Kubernetes开发环境。用户可以通过创建YAML配置文件并使用kubectl CLI访问集群，在H100 GPU上运行云原生AI工作负载，并安装Nvidia GPU Operator以验证GPU访问。

🎯

❓

首先确保Docker已正确配置，使用Nvidia运行时作为默认设置。然后克隆nvkind的GitHub仓库并构建二进制文件，最后执行nvkind二进制文件以检查构建是否成功。

创建一个名为nvkind-cluster.yaml的YAML文件，定义集群的角色和GPU的暴露设置，然后使用命令nvkind cluster create --config-template=nvkind-cluster.yaml创建集群。

安装Nvidia GPU Operator后，确保gpu-operator命名空间中的所有pod都处于健康状态，然后创建一个测试pod以验证GPU访问。

nvkind集群主要用于在Docker环境中运行云原生AI工作负载，并支持GPU的访问和管理。

需要安装nvkind，创建YAML配置文件，使用kubectl CLI访问集群，并安装Nvidia GPU Operator以确保GPU可用。

确保Docker已正确配置，并将Nvidia运行时设置为默认，以便从Docker容器访问GPU。

🏷️

在Kubernetes中管理Valkey集群
Percona推出Valkey Operator，支持在Kubernetes中管理Valkey数据库。新功能包括配置参数、用户权限管理和TLS加密支持，用...
Kubernetes 初学者指南
Kubernetes 是一种基础设施平台，通过承诺管理系统，确保各部分持续履行承诺，维护整体功能。
太好看了，媲美Sun的个人导航页，NAS部署星云门户
本文介绍了开源项目星云门户，专为NAS用户设计，提供多功能导航页，包括天气展示、搜索引擎自定义、状态栏拖动、服务器监控和书签管理。用户可通过Docker轻...
人工智能沙箱正迎来其Kubernetes时刻
Anthropic的新模型Mythos能够自主发现并利用操作系统和浏览器的零日漏洞，揭示了当前安全架构的缺陷。大多数安全产品仅生成日志，未能有效提高系统安...
阿里云 ESA 免费 CDN 教程：全球加速 + DDoS 防护，手把手续期至 2051 年
本文介绍了阿里云ESA的免费CDN使用教程，用户可申请免费版并设置续费规则，将有效期延长至2051年。操作步骤包括进入申请页面、选择免费版、管理套餐和设置...
DeepSeek V4 发布没炸场，却靠降价掀起革命？
本文拆解DeepSeek V4连续降价如何改变AI模型使用成本，帮助开发者和低频用户判断是否还要购买Coding Plan或Token Plan。文章围绕...