Planet PostgreSQL ·

托马斯·冯德拉：[补丁想法] `IN` 查询的自适应执行

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

上周我参加了马尔默PUG会议，讨论了IN查询性能问题。元素数量限制了性能，线性搜索和哈希表的选择阈值不够灵活。建议在运行时收集成本数据，以动态调整策略，从而提高查询效率，但需解决测量成本的准确性和平台支持问题。

🎯

🔎

IN查询的性能受限于元素数量，线性搜索和哈希表的选择阈值是硬编码的。这意味着在某些情况下，查询性能可能会意外下降，尤其是在元素数量接近阈值时。了解这一点对于优化数据库查询至关重要。

建议在运行时收集成本数据以动态调整查询策略，这一方法可以提高查询效率。然而，如何准确测量不同策略的成本是一个主要风险，可能影响最终的性能提升效果。

在实现动态策略调整时，平台支持是一个重要考虑因素。不同平台可能需要不同的解决方案，例如x86和arm64架构的支持。这种复杂性可能会影响补丁的普适性和实施效果。

❓

IN查询性能问题主要是由于元素数量限制了查询效率，线性搜索和哈希表的选择阈值不够灵活。

可以在运行时收集成本数据，以动态调整查询策略，从而提高IN查询的执行效率。

当前的阈值是硬编码的，线性搜索用于最多8个元素的列表，9个及以上元素则使用哈希表。

主要风险包括如何准确测量不同策略的成本，以及平台支持的问题。

需要更新表达式解释器以支持在执行时动态调整查询策略，而不是仅在查询规划时决定策略。

可以通过在运行时测量每种策略的执行时间来收集成本数据，以便调整阈值。

🏷️