最近,PostgreSQL主分支更新优化了SELECT COUNT(h)的性能,提升可达64%。新特性允许查询优化器在特定情况下将COUNT(ANY)转换为COUNT(*),减少数据提取和空值检查的开销。这一改进将包含在PostgreSQL 19版本中,用户在使用COUNT(1)或COUNT(id)时将自动获得COUNT(*)的最佳性能。
查询优化器旨在选择最佳查询计划,但其选择依赖于成本估算,实际选择常常不准确。对于不同的选择性,索引扫描并不总是最佳,位图扫描在大多数情况下表现更佳。尽管优化器基于统计和成本模型进行选择,但可能并非最佳。改进统计和成本模型是必要的,但信息总会缺失。尽管如此,基于成本的规划仍是最佳方法。
该研究提出了一种基于双向图神经网络和门控递归单元的树模型架构,以提高查询优化器的成本估计准确性和可解释性,从而提升查询性能和量化不确定性。
本文讨论了MySQL 8.0.22中GROUP BY的工作原理和查询优化器中的优化逻辑,介绍了四种GROUP BY的实现方式和优化建议,以及GaussDB(for MySQL)的兼容性和并行查询支持。
8月8日和8月15日举行了第一和第二届“PostgreSQL黑客研讨会”,参与者观看了CMU数据库组举办的“疫苗数据库技术讲座(2021年)”的视频,并在研讨会上提出问题。第一次研讨会有9人参加,第二次有14人参加。讨论的主题包括PostgreSQL优化器方法论、查询优化器和查询计划的复杂性、采样和统计数据的更新。参与者希望从这些讨论中获得对未来发展的启示。
完成下面两步后,将自动完成登录并继续当前操作。