支撑 “千万设备日活” 的创米数联 7 年微服务架构演进之路

💡 原文中文,约5000字,阅读约需12分钟。
📝

内容提要

创米数联是小米生态链的一员,专注于智能家居产品的研发、设计、生产和销售。他们以居家安全为核心,提供多品类的全屋智能家居产品及服务。创米数联已在全球150多个国家销售了超过5500万台设备,拥有1600万设备和500万设备用户日活。他们采用微服务架构和阿里云容器服务来应对稳定性和安全挑战。使用Spring Cloud Alibaba、Nacos和MSE微服务治理等技术构建微服务基础架构。通过统一的上游消息网关和全链路灰度流量治理解决流量治理问题。通过阿里云链路追踪服务和ARMS监控实现可观测性。将CI/CD流程迁移到阿里云云效,并使用混沌工程评估稳定性。未来计划将业务网关转型为云原生网关+WASM插件方案,提升性能和灵活性。

🎯

关键要点

  • 创米数联是小米生态链的一员,专注于智能家居产品的研发、设计、生产和销售。

  • 公司以居家安全为核心,提供多品类的全屋智能家居产品及服务。

  • 截至2021年,创米数联在全球150多个国家销售超过5500万台设备,拥有1600万设备和500万日活用户。

  • 创米采用微服务架构应对稳定性和安全挑战,使用阿里云容器服务。

  • 云服务自2016年起选择云计算+微服务技术路线,构建微服务组件以应对流量挑战。

  • 2019年起,创米开始研发自有APP和适配自有APP的智能家居设备。

  • 云服务部将服务部署在阿里云的多个Region,利用阿里云提供的基础设施降低运维压力。

  • 创米云服务逐步转向云原生架构,目标是实现可观测性和全链路流量治理。

  • 使用Spring Cloud Alibaba和Nacos替换原有架构中的Eureka和Apollo,以提高稳定性和可用性。

  • 全链路流量治理采用统一的上游消息网关和多级过滤器,处理来自设备端的多种消息流。

  • 创米云服务实现了无损上下线,避免了流量损失导致的请求不可用问题。

  • 可观测性通过阿里云SLS日志服务和Skywalking实现,帮助解决接口性能问题。

  • CI/CD流程迁移到阿里云云效,实现全自动化的构建和部署流程。

  • 通过混沌工程评估稳定性,发现并修复了部分漏洞,增强了架构的健壮性。

  • 未来计划将业务网关转型为云原生网关+WASM插件方案,提升性能和灵活性。

🏷️

标签

➡️

继续阅读