The New Stack ·

在Kubernetes上通过远程MCP架构扩展大型语言模型工具

💡 原文英文，约2200词，阅读约需8分钟。

📝

内容提要

随着人工智能系统从实验阶段转向生产，开发者发现大型语言模型（LLM）在单台笔记本电脑上无法扩展。早期的本地模型上下文协议（MCP）服务器在实际工作流中表现不佳，导致崩溃和版本更新问题。为了解决这些问题，MCP工具被迁移到Kubernetes上，以实现可扩展性、可观察性和安全性，支持生产环境中的AI系统。

🎯

关键要点

人工智能系统从实验阶段转向生产阶段，开发者发现大型语言模型（LLM）在单台笔记本电脑上无法扩展。
早期的本地模型上下文协议（MCP）服务器在实际工作流中表现不佳，导致崩溃和版本更新问题。
MCP工具被迁移到Kubernetes上，以实现可扩展性、可观察性和安全性，支持生产环境中的AI系统。
MCP架构通过使用Amazon Elastic Kubernetes Service (EKS)和Elastic Container Registry (ECR)实现远程部署。
MCP工具的远程架构使得团队能够独立更新工具而不影响彼此的工作流。
Kubernetes提供了可扩展性、清晰的责任分离、滚动更新和更好的网络访问控制。
MCP工具的请求流通过Kubernetes的ALB和EKS进行处理，简化了故障排除和观察。
远程MCP架构的关键优势包括独立扩展、清晰的操作边界、易于升级和实验、支持多个工具以及更好的安全性。
MCP的采用正在增长，预计云原生模式将成为AI工程团队的默认选择。

🏷️

在Kubernetes上通过远程MCP架构扩展大型语言模型工具

内容提要

关键要点

标签