湖仓一体架构在火山引擎 LAS 的探索与实践
💡
原文中文,约8600字,阅读约需21分钟。
📝
内容提要
LAS是字节跳动提供的一站式EB级海量数据存储计算和交互分析服务,基于湖仓一体架构,支持Spark和Presto生态,帮助企业构建智能实时湖仓。LAS的核心是ByteLake数据湖内核,提供统一的元数据服务、高效数据更新、高并发性能等特性。LAS还提供了CatalogService、BMS和TMS等服务,解决元数据管理、异步任务托管和批流融合计算等问题。在抖音电商和消费行业的业务实践中,LAS能够快速入湖、解决宽表构建成本高、计算周期长等问题。
➡️