Planet PostgreSQL ·

Josef Machytka：深入探讨PostgreSQL 18中的旧UUIDv4与新UUIDv7

💡 原文英文，约2900词，阅读约需11分钟。

📝

内容提要

UUID作为PostgreSQL主键的使用引发讨论。UUIDv4完全随机，导致索引碎片化和随机I/O，而UUIDv7引入时间戳，显著改善了索引性能和物理布局，适合大规模数据应用。

🎯

🔎

UUIDv4由于其完全随机的特性，导致索引碎片化和随机I/O，影响查询性能。而UUIDv7通过引入时间戳，显著改善了索引的物理布局和查询速度。在处理大规模数据时，UUIDv7的插入速度和查询效率都优于UUIDv4，适合用于需要高性能的应用场景。

UUIDv7的设计中嵌入了创建时间戳，这虽然提高了索引性能，但也可能泄露记录的近似创建时间。在某些应用中，这可能被视为信息泄露，因此在选择使用UUIDv7时，需要考虑数据隐私和安全性。

PostgreSQL 18引入了对UUIDv7的原生支持，使得开发者可以更方便地利用时间有序的UUID作为主键。这一变化不仅提升了数据库的性能，还保持了UUID的唯一性和分布式生成的优势，为大规模数据处理提供了更好的解决方案。

❓

UUIDv4是完全随机的，导致索引碎片化和随机I/O，而UUIDv7引入时间戳，改善了索引性能和物理布局。

UUIDv7的插入速度显著快于UUIDv4，且其索引结构更为紧凑和连续，适合大规模数据应用。

在PostgreSQL 18中，可以使用uuidv7()函数生成UUIDv7。

UUIDv4的随机性导致频繁的B树页面分裂和高度碎片化的主键索引，增加了随机I/O。

UUIDv7嵌入的时间戳可能会泄露近似的创建时间，但在大多数情况下是可接受的。

UUID提供了极大的唯一性，几乎不可能出现重复，适合需要分布式生成的应用场景。

🏷️