Glossary

Glossary

💡 原文中文,约1300字,阅读约需3分钟。
📝

内容提要

AI 原生基础设施以模型为核心,算力为稀缺资源,不确定性为常态,强调术语一致性以促进治理与沟通。核心概念包括模型行为体、算力治理和意图与执行平面,形成闭环管理。

🎯

关键要点

  • AI 原生基础设施以模型为核心,算力为稀缺资源,不确定性为常态。
  • 统一术语是组织形成共识的第一步,关键术语必须保持一致。
  • 核心术语包括 AI 原生基础设施、模型行为体、算力稀缺、默认不确定、意图平面、执行平面、治理平面、闭环、算力治理、FinOps、智能体、MCP 和运行模型。
  • 模型行为体是执行主体,具备行动能力,需要治理与审计。
  • 算力成为核心稀缺资产,扩容受供应链与机房条件约束,成本不可弹性化。
  • 行为与资源消耗高度不确定,需要验证与回退机制。
  • 意图平面负责表达需求,包括优先级、预算、合规等策略。
  • 执行平面负责将意图落地为真实执行,包括状态管理、工具调用等。
  • 治理平面负责限定资源后果,包括拓扑感知调度、SLO 与风险策略。
  • 闭环包括意图、消耗、成本/风险结果的四个步骤:准入、转译、计量、执行。
  • 算力治理关注资源后果,包括 Token 经济、加速器时间、互连与存储等。
  • FinOps 将成本治理嵌入架构,确保性能与成本的平衡。
  • 智能体通过选择和调用工具完成任务,其行为路径与资源消耗具有不确定性。
  • MCP 标准化工具访问,定义能力如何暴露给模型/智能体。
  • 运行模型涉及组织与运行方式的制度设计,明确责任边界与决策流程。

延伸问答

什么是AI原生基础设施?

AI原生基础设施是以模型为核心,算力为稀缺资源,不确定性为常态,通过算力治理形成意图、执行、资源消耗与经济风险结果的闭环管理体系。

算力稀缺的原因是什么?

算力稀缺是由于GPU、互连、功耗和带宽等资源的供应链与机房条件限制,导致扩容受限且成本不可弹性化。

意图平面和执行平面有什么区别?

意图平面负责表达需求和策略,如优先级和预算,而执行平面则负责将这些意图转化为实际执行,包括状态管理和工具调用。

闭环管理的四个步骤是什么?

闭环管理包括准入、转译、计量和执行四个步骤,形成意图、消耗与成本/风险结果的闭环。

什么是FinOps,它的作用是什么?

FinOps是将成本治理嵌入架构的过程,确保在扩展决策中同时考虑性能和成本的平衡。

模型行为体的角色是什么?

模型行为体是执行主体,具备行动能力,能够调用工具和修改系统状态,因此需要进行治理与审计。

➡️

继续阅读