小红花·文摘

LakeSoul是一种创新的数据湖仓一体架构，旨在降低传统数据仓库的复杂性和存储成本。它基于LSM-Tree设计，支持高并发更新和高效读取，元数据管理使用PostgreSQL，具备良好的扩展性和权限控制。支持多种计算引擎，适应不同场景，自动化运维降低人工维护成本，适合数字化转型企业。

湖仓一体架构LakeSoul，让数据处理效率爆增10倍！告别传统数据仓库的笨重！

dotNET跨平台 ·

Databricks“三级跳”：600 亿美元独角兽的战略跃迁

OneFlow深度学习框架 ·

湖仓一体是现代数据平台，结合了数据湖和数据仓库的特点，解决了数据孤岛和性能瓶颈等问题。华为云DWS湖仓一体方案已广泛应用于金融、电信、政府、医疗等行业。未来DWS将增强数据入湖能力，实现更灵活的计费模式。

解读基于华为云DWS的湖仓一体方案构建

华为云官方博客 ·

本文介绍了使用Flink CDC + Iceberg + Doris构建实时湖仓一体的联邦查询分析，展示了Doris和Iceberg的使用，介绍了Doris的架构和支持的外部表类型，演示了创建MySQL数据库表和初始化数据，创建Iceberg Catalog和Mysql CDC表，以及在Doris中创建Iceberg外表和查询Iceberg数据。文章指出Doris支持联合查询分析，提供统一的查询分析入口。

Apache Doris 整合 FLINK CDC + Iceberg 构建实时湖仓一体的联邦查询

京东科技开发者 ·

在基于 Amazon 云平台的湖仓一体架构上构建数据血缘的探索和实践

亚马逊AWS官方博客 ·

本文介绍了阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。MaxCompute具有快速、完全托管的特点，支持统一的存储、元数据和计算引擎一体化设计。该架构包括数据接入、计算引擎、数据优化服务、元数据管理和数据文件组织等模块。未来，MaxCompute将持续完善功能支持、丰富数据接入工具、优化查询效率和数据文件管理，并扩展生态融合。

MaxCompute 湖仓一体近实时增量处理技术架构揭秘

阿里云云栖号 ·

本文介绍了GaussDB(DWS)云原生数仓的架构和产品能力，包括极致弹性、湖仓一体和数智融合。架构演进从Shared Storage到Shared Nothing再到存算分离。优异性能通过缓存、近数据计算和IO调度保证。开发者可观看直播回放和关注GaussDB(DWS)论坛获取更多信息。

GaussDB(DWS)云原生数仓技术解析

华为云官方博客 ·

LAS是字节跳动提供的一站式EB级海量数据存储计算和交互分析服务，基于湖仓一体架构，支持Spark和Presto生态，帮助企业构建智能实时湖仓。LAS的核心是ByteLake数据湖内核，提供统一的元数据服务、高效数据更新、高并发性能等特性。LAS还提供了CatalogService、BMS和TMS等服务，解决元数据管理、异步任务托管和批流融合计算等问题。在抖音电商和消费行业的业务实践中，LAS能够快速入湖、解决宽表构建成本高、计算周期长等问题。

湖仓一体架构在火山引擎 LAS 的探索与实践

字节跳动技术团队官方博客 ·