Planet PostgreSQL ·

安德鲁·阿特金森：Ruby on Rails 和 PostgreSQL 中大 IN 列表带来的大问题

💡 原文英文，约2200词，阅读约需8分钟。

📝

内容提要

在数据库中，使用大IN列表查询会影响性能，尤其在数据量大时。可以通过JOIN操作、ANY运算符、VALUES子句或准备语句替代IN查询来优化性能。使用pg_stat_statements可以识别并优化这些查询。

🎯

🔎

在数据库中使用大IN列表查询时，性能问题尤为明显，尤其是在数据量较大时。这是因为解析和执行大列表所需的资源消耗显著增加，可能导致查询计划选择不当，从而影响整体性能。开发者应关注查询的复杂性，避免在高负载情况下使用大IN列表。

为了提高查询性能，开发者可以考虑使用JOIN操作、ANY运算符或VALUES子句等替代方案。这些方法不仅能减少资源消耗，还能提高查询的灵活性和效率。特别是在处理大量数据时，使用JOIN可以更好地利用索引和统计信息，从而优化查询计划。

使用pg_stat_statements工具可以帮助开发者识别和优化大IN列表查询。通过分析查询统计信息，开发者能够发现潜在的性能瓶颈，并采取相应措施进行优化。定期监控查询性能是确保数据库高效运行的重要步骤。

❓

大IN列表查询会增加解析、规划和执行过程中的资源消耗，导致性能下降，尤其是在数据量大的情况下。

可以通过使用JOIN操作、ANY运算符、VALUES子句或准备语句来优化大IN列表查询的性能。

使用pluck()方法收集ID并将其作为参数传递给另一个查询时，可能会生成大IN列表的查询模式。

可以使用eager_load方法替代includes或preload，这样可以生成使用LEFT OUTER JOIN的单个SQL查询，避免大IN列表。

PostgreSQL 17和18版本将改进处理标量表达式和索引，提升查询性能，减少重复扫描。

可以通过查询pg_stat_statements中的query字段，使用LIKE语句过滤出包含'IN'的查询，以识别大IN列表查询。

🏷️