支撑 “千万设备日活” 的创米数联 7 年微服务架构演进之路
内容提要
创米数联是小米生态链的一员,专注于智能家居产品的研发、设计、生产和销售。他们以居家安全为核心,提供多品类的全屋智能家居产品及服务。创米数联已在全球150多个国家销售了超过5500万台设备,拥有1600万设备和500万设备用户日活。他们采用微服务架构和阿里云容器服务来应对稳定性和安全挑战。使用Spring Cloud Alibaba、Nacos和MSE微服务治理等技术构建微服务基础架构。通过统一的上游消息网关和全链路灰度流量治理解决流量治理问题。通过阿里云链路追踪服务和ARMS监控实现可观测性。将CI/CD流程迁移到阿里云云效,并使用混沌工程评估稳定性。未来计划将业务网关转型为云原生网关+WASM插件方案,提升性能和灵活性。
关键要点
-
创米数联是小米生态链的一员,专注于智能家居产品的研发、设计、生产和销售。
-
公司以居家安全为核心,提供多品类的全屋智能家居产品及服务。
-
截至2021年,创米数联在全球150多个国家销售超过5500万台设备,拥有1600万设备和500万日活用户。
-
创米采用微服务架构应对稳定性和安全挑战,使用阿里云容器服务。
-
云服务自2016年起选择云计算+微服务技术路线,构建微服务组件以应对流量挑战。
-
2019年起,创米开始研发自有APP和适配自有APP的智能家居设备。
-
云服务部将服务部署在阿里云的多个Region,利用阿里云提供的基础设施降低运维压力。
-
创米云服务逐步转向云原生架构,目标是实现可观测性和全链路流量治理。
-
使用Spring Cloud Alibaba和Nacos替换原有架构中的Eureka和Apollo,以提高稳定性和可用性。
-
全链路流量治理采用统一的上游消息网关和多级过滤器,处理来自设备端的多种消息流。
-
创米云服务实现了无损上下线,避免了流量损失导致的请求不可用问题。
-
可观测性通过阿里云SLS日志服务和Skywalking实现,帮助解决接口性能问题。
-
CI/CD流程迁移到阿里云云效,实现全自动化的构建和部署流程。
-
通过混沌工程评估稳定性,发现并修复了部分漏洞,增强了架构的健壮性。
-
未来计划将业务网关转型为云原生网关+WASM插件方案,提升性能和灵活性。