对比分析数仓中行列存的特性

💡 原文中文,约2100字,阅读约需5分钟。
📝

内容提要

GaussDB(DWS)存储引擎支持行列存,行存适合OLTP业务,列存适合数据仓库业务,可以优化行列存join的执行计划,但不支持小量insert及update操作。

🎯

关键要点

  • GaussDB(DWS)存储引擎支持行列存,行存适合OLTP业务,列存适合数据仓库业务。

  • 行存表示传统的数据存储方式,适合交互事务较多的场景。

  • 列存适合进行大量汇聚计算,且涉及的列操作较少。

  • 列存的优势包括高压缩比、减少IO读、提高CPU缓存命中率,适合OLAP分析。

  • 列存的劣势是不适合小量insert和update操作。

  • 行存的优势在于点查询和频繁的增删改操作。

  • 行存和列存的支持范围不同,存在索引失效和并发更新问题。

  • 列存表推荐使用批量插入,单行插入会造成空间浪费。

  • 行列存JOIN的执行计划可能不符合预期,可以通过设置参数进行优化。

  • 手工基础行转列操作需要加锁或在事务中执行。

➡️

继续阅读