Hudi系列:Hudi核心概念之文件布局(Storage Layouts)

📝

内容提要

•每个切片包含一个基本文件 (parquet/orc/hfile)(由配置 - hoodie.table.base.file.format 定义),由在特定时刻完成的提交写入,以及一组日志文件 (.log.),由在下一个基本文件请求时刻之前完成的提交写入。日志文件包含不同的块(数据、命令、删除块等),这些块对基础文件的特定更改进行编码。•Hudi 采用多版本并发控制...

🏷️

标签

➡️

继续阅读