💡
原文英文,约1500词,阅读约需6分钟。
📝
内容提要
GBase数据库是一种高性能关系数据库,广泛应用于数据分析。GBase 8a MPP集群采用无共享架构,具备高性能和可扩展性。本文探讨了GBase 8a的分布式执行计划,重点分析了数据分布、连接和分组操作的实现原理及关键参数。
🎯
关键要点
- GBase数据库是一种高性能关系数据库,广泛应用于数据分析和性能优化场景。
- GBase 8a MPP集群采用无共享架构,提供高性能、高可用性和高可扩展性。
- GBase 8a支持两种数据分布策略:哈希分布和随机分布。
- 哈希分布通过指定的列计算哈希值,确定数据存储的节点。
- 复制表在每个节点上包含完整数据的副本。
- 分布式连接执行计划有两种基本模型:分布式表连接和复制表连接。
- 小表广播连接执行计划用于小表与大表的连接。
- 单表重分布连接执行计划用于连接条件包含分布列的情况。
- 双表重分布连接执行计划用于连接条件不包含任何分布列的情况。
- 分布式分组执行计划有两种基本模型:哈希分布表和复制表。
- 执行计划参数影响SQL执行时选择的具体执行计划。
- gcluster_hash_redistribute_join_optimize参数控制动态重分布。
- gcluster_hash_redist_threshold_row参数是自动重分布的阈值。
- gcluster_hash_redistribute_groupby_optimize参数控制分组的动态重分布。
➡️