The New Stack ·

云原生开源世界中AI合规性的下一阶段

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

Kubernetes上的AI工作负载标准化已成为行业优先事项。CNCF的AI一致性计划旨在提高可移植性和生产准备度，解决不同云提供商间的兼容性问题。预计到2026年底，AI推理计算需求将大幅增加，Kubernetes被视为理想的推理运行时。llm-d项目将促进云原生生态系统的互操作性，推动AI开发的标准化和自动化测试。

🎯

关键要点

在Kubernetes上运行AI模型曾经是一个猜测的过程，不同云提供商之间的兼容性问题严重。
CNCF的Kubernetes AI一致性计划旨在标准化AI和机器学习工作负载的运行方式，提高可移植性和生产准备度。
预计到2026年底，AI推理计算需求将大幅增加，推理计算将占AI工作负载的三分之二。
Kubernetes被认为是AI推理的理想运行时，能够提供弹性、成本效益和低延迟的模型服务。
llm-d项目被纳入CNCF孵化器计划，旨在促进云原生生态系统的互操作性。
AI一致性计划的初步标准包括以标准方式在Kubernetes集群中暴露加速器，以满足工作负载需求。
随着AI驱动开发的成熟，新的网络和存储要求将出现，企业需要重新认证。

❓

延伸问答

Kubernetes上的AI工作负载标准化的目的是什么？

目的是提高可移植性和生产准备度，解决不同云提供商间的兼容性问题。

预计到2026年底，AI推理计算的需求将如何变化？

预计AI推理计算需求将大幅增加，推理计算将占AI工作负载的三分之二。

llm-d项目的主要功能是什么？

llm-d项目提供一个预集成的Kubernetes原生分布式参考框架和编排管理器，促进高层控制平面与低层推理引擎之间的连接。

CNCF的AI一致性计划初步标准包括哪些内容？

初步标准包括以标准方式在Kubernetes集群中暴露加速器，以满足工作负载需求。

Kubernetes被认为是AI推理的理想运行时的原因是什么？

因为Kubernetes能够提供弹性、成本效益和低延迟的模型服务，适合实时推理需求。

AI一致性计划如何影响云原生生态系统的互操作性？

AI一致性计划通过标准化AI和机器学习工作负载，促进云原生生态系统的互操作性。

🏷️

继续阅读

更快速的AI能耗估算方法
麻省理工学院与MIT-IBM沃森人工智能实验室开发了EnergAIzer工具，能够快速预测AI工作负载的能耗，帮助数据中心高效分配资源，减少能源浪费。该工...
超越提示：KubeStellar如何通过AI代理实现81%的PR接受率
作者分享了构建KubeStellar Console的经历，这是一个Kubernetes多集群管理仪表板。最初使用AI辅助编程提高了效率，但随后遇到许多问...
平台团队的Kubernetes：利用k0s和k0rdent
本文探讨了如何通过结合k0s、k0rdent和托管控制平面（HCP）在OpenStack上高效管理多集群Kubernetes环境。HCP通过集中管理控制平...
墨探：把互联网每一篇好文章，变成 AI 与知识库通用的纯净 Markdown
墨探是一款开源工具，旨在帮助知识工作者解决文章格式混乱的问题。它能够一键抓取网页正文，剥离冗余内容，并输出结构化的Markdown格式，便于长期存储和复用...
为什么开发者选择Postgres作为AI的数据库
随着AI应用的快速发展，企业需要可靠的数据支持。PostgreSQL因其开源、易用和可扩展性，被认为是构建AI应用的最佳数据库。它支持结构化和非结构化数据...
加入谷歌与Kaggle联合推出的新AI代理氛围编码课程
谷歌将于2026年6月15日至19日重新推出为期五天的AI代理密集课程，面向150万学习者。课程内容更新，包含新讲者和实践项目，免费注册。将深入探讨构建强...