对比分析数仓中行列存的特性
💡
原文中文,约2100字,阅读约需5分钟。
📝
内容提要
GaussDB(DWS)存储引擎支持行列存,行存适合OLTP业务,列存适合数据仓库业务,可以优化行列存join的执行计划,但不支持小量insert及update操作。
🎯
关键要点
-
GaussDB(DWS)存储引擎支持行列存,行存适合OLTP业务,列存适合数据仓库业务。
-
行存表示传统的数据存储方式,适合交互事务较多的场景。
-
列存适合进行大量汇聚计算,且涉及的列操作较少。
-
列存的优势包括高压缩比、减少IO读、提高CPU缓存命中率,适合OLAP分析。
-
列存的劣势是不适合小量insert和update操作。
-
行存的优势在于点查询和频繁的增删改操作。
-
行存和列存的支持范围不同,存在索引失效和并发更新问题。
-
列存表推荐使用批量插入,单行插入会造成空间浪费。
-
行列存JOIN的执行计划可能不符合预期,可以通过设置参数进行优化。
-
手工基础行转列操作需要加锁或在事务中执行。
➡️