Timescale Blog ·

分析中的行存储与列存储：为什么PostgreSQL的扫描速度比应有的慢

💡 原文英文，约1700词，阅读约需6分钟。

📝

内容提要

本文讨论了Postgres在处理时间序列数据时的存储效率，指出行存储模型导致的I/O浪费。通过计算读取放大比，分析存储布局对查询的影响。建议采用混合存储模型（如Tiger Data的Hypercore）以提升读取性能，特别是在高频写入场景下。

🎯

🔎

PostgreSQL的行存储模型在高频写入场景下表现出明显的I/O浪费，尤其是在分析查询中。由于每次读取都需要加载整个行的数据，导致不必要的数据传输和处理，影响查询性能。了解这一点对于优化数据库性能至关重要。

读取放大比是评估存储布局对查询影响的重要指标。通过计算总行宽度与实际查询列宽度的比值，用户可以识别出存储模型是否成为I/O瓶颈。如果比值超过5倍，建议考虑混合存储模型以提升性能。

混合存储模型（如Tiger Data的Hypercore）结合了行存储和列存储的优点，能够在高频写入时保持快速的写入性能，同时在分析查询时显著减少读取的数据量。这种灵活性使得数据库在不同场景下都能高效运行。

❓

PostgreSQL的行存储模型导致在分析查询中读取整个行，造成不必要的I/O浪费，特别是在需要多个列的查询中。

读取放大比是评估存储布局对分析查询影响的重要公式，计算方法是总行宽度除以查询所需列的宽度。

可以采用混合存储模型，如Tiger Data的Hypercore，允许新数据以行格式快速写入，旧数据则转换为列式格式。

列式存储按列组织数据，显著减少读取的数据量，提高压缩效率，适合分析查询。

对于分析查询，索引优化主要针对行选择，而读取数据的速度受行宽度影响，索引无法解决这一问题。

可以通过查询全行字节数和所需列字节数，计算读取放大比，公式为总行宽度除以查询列宽度。

🏷️