Uber实时数据基础设施:分布式计算架构
📝
内容提要
Uber 的实时数据基础设施: Apache Kafka 用于流式存储, Flink 用于流处理, Pinot 用于 OLAP, HDFS 用于归档存储, Presto 用于交互式查询 数据来源与挑战 Uber 生成的主要数据来源是其数据中心内的最终用户应用程序,例如 Uber(拼车)和 UberEats。这些数据包括客户端事件和来自优步应用程序中运行的 微服务...
➡️