字节跳动开源其云原生数据仓库 ByConity
💡
原文中文,约4600字,阅读约需11分钟。
📝
内容提要
ByConity是一个开源的云原生数据仓库,提供资源隔离、读写分离、弹性扩缩容和数据强一致性等功能。其架构分为服务接入层、计算层和数据存储层,结合主流的OLAP引擎优化,提供优异的读写性能。ByConity致力于成为未来云原生数据仓库的重要工具。
🎯
关键要点
- ByConity是字节跳动开源的云原生数据仓库,支持计算-存储分离架构。
- 提供资源隔离、读写分离、弹性扩缩容和数据强一致性等关键功能。
- ByConity的架构分为服务接入层、计算层和数据存储层,优化了读写性能。
- 项目背景源于2018年字节跳动内部使用ClickHouse的经验,解决了扩缩容成本高和多租户影响等问题。
- ByConity于2020年启动,2023年1月发布Beta版本,5月底正式开源。
- 计算与存储分离架构使得计算节点无状态,支持动态扩缩容。
- 支持多租户资源隔离,确保不同租户之间不相互影响。
- 查询优化器通过规则和成本优化提升查询性能,支持复杂查询场景。
- 支持Cache-aware和Resource-aware两种查询调度策略,最大化资源利用。
- 提供高可用的元数据管理服务,支持ACID事务特性。
- 虚拟文件系统模块实现存储服务化,支持多种后端存储系统。
- 通过缓存加速查询性能,提升元数据和数据维度的查询速度。
- 支持单机Docker、K8s集群、物理机部署和源代码编译等多种获取和部署模式。
- 2023年开源规划包括性能提升、稳定性增强和企业级特性增强等方向。
- 社区合作共建得到了多家企业的支持,未来将继续与社区伙伴共同发展。
➡️