Planet PostgreSQL ·

汉斯-尤尔根·肖宁：# GROUP BY：修复优化器估计

💡 原文英文，约1900词，阅读约需7分钟。

📝

内容提要

在PostgreSQL进行大规模聚合时，优化器可能会错误估计行数，尤其是当GROUP BY包含多个列时。通过创建扩展统计信息，可以改善估计，提升查询性能。

🎯

关键要点

在PostgreSQL进行大规模聚合时，优化器可能会错误估计行数，尤其是当GROUP BY包含多个列时。
GROUP BY语句包含的列越多，优化器过高估计行数的可能性就越大。
通过创建扩展统计信息，可以改善估计，提升查询性能。
使用generate_series函数可以快速向表中插入大量数据。
ANALYZE命令用于创建新的优化器统计信息。
PostgreSQL优化器依赖于每列的统计信息来做出估计。
当列之间存在依赖关系时，优化器可能会错误估计返回的行数。
CREATE STATISTICS命令可以用于定义扩展统计信息，以改善估计。
使用扩展统计信息后，优化器的估计会显著改善，查询性能也会提高。
pg_stats_ext视图提供了关于扩展统计信息的详细信息，帮助优化器做出更准确的估计。

❓

延伸问答

PostgreSQL中的GROUP BY语句如何影响优化器的行数估计？

GROUP BY语句包含的列越多，优化器过高估计行数的可能性就越大。

如何通过扩展统计信息改善PostgreSQL的查询性能？

通过创建扩展统计信息，可以改善优化器的估计，从而提升查询性能。

在PostgreSQL中，ANALYZE命令的作用是什么？

ANALYZE命令用于创建新的优化器统计信息，以帮助优化器做出更准确的估计。

如何使用CREATE STATISTICS命令来改善行数估计？

CREATE STATISTICS命令可以定义扩展统计信息，以改善对多个列组合的估计。

PostgreSQL优化器是如何进行行数估计的？

优化器依赖于每列的统计信息，通过乘法计算各列的可能值来估计行数。

pg_stats_ext视图提供了哪些关于扩展统计信息的信息？

pg_stats_ext视图提供了扩展统计信息的详细数据，帮助优化器做出更准确的估计。

🏷️

标签

PostgreSQL 优化器扩展统计信息查询性能聚合

➡️

继续阅读

小型Postgres元数据表如何悄然限制您的最大查询
在处理时间序列数据时，PostgreSQL使用ORDER BY可能导致查询变慢。通过使用time_bucket和连续聚合，可以将查询时间从4秒缩短至9毫秒...
科尔内利亚·比亚奇克斯：第25周的贡献
2026年6月23日至26日，多个PostgreSQL用户组将在欧洲举行会议，讨论PostgreSQL的最新进展和技术，演讲者将分享经验。
在良好开局后，DC的新电影宇宙已经放缓
While Kara Zor-El's appearance at the end of James Gunn's Superman wa...
泄露的iPhone 18 Pro照片 reportedly 出现在暗网上
Leaked iPhone 18 Pro photos and parts lists appeared on the dark web followin...
Turbopack：Next.js 16.3的新特性
Next.js 16.3版本引入了Turbopack的多项改进，重点提升编译性能和减少内存使用。新特性包括持久文件系统缓存、实验性Rust React编译...
本月DSF成员 - 萨利姆·努鲁
萨利姆·努鲁是Django社区的活跃成员，曾参与DjangoCon非洲会议并担任DjangoCon美国网站主席。他是一名专注于安全研究的软件工程师，正在开...