丹尼尔·维里特:探讨PostgreSQL 17中新内置排序规则提供者

丹尼尔·维里特:探讨PostgreSQL 17中新内置排序规则提供者

💡 原文英文,约2500词,阅读约需9分钟。
📝

内容提要

PostgreSQL 17引入了内置的UTF-8区域设置和二进制字符串比较的排序规则。新的排序规则是不可变的,并保证在不同系统上具有一致的排序语义。它支持完整的Unicode字符分类,并提供快速、与操作系统无关的二进制排序。新的排序规则在索引和搜索操作中表现出更快的性能。然而,它不像语言排序规则那样以“人类方式”对字符串进行排序。文章提供了使用新的排序规则的说明,并讨论了它的优点和局限性。

🎯

关键要点

  • PostgreSQL 17引入了内置的UTF-8区域设置和二进制字符串比较的排序规则。
  • 新排序规则是不可变的,确保在不同系统上具有一致的排序语义。
  • 新排序规则支持完整的Unicode字符分类,并提供快速的二进制排序。
  • PostgreSQL 17增加了一个内置的排序提供者,提供与C排序相似的排序语义。
  • 新提供者的排序规则在索引和搜索操作中表现出更快的性能。
  • 使用新排序规则时,创建数据库时需指定locale名称为C.UTF8和提供者为'builtin'。
  • 新排序规则在字节比较上使用更少的CPU,性能优于语言比较。
  • 二进制排序的主要缺点是无法以“人类方式”对字符串进行排序。
  • 使用COLLATE子句可以在查询中实现语言排序。
  • 新内置的C.UTF-8区域设置和pg_c_utf8排序规则提供了快速、可移植的Unicode数据库默认设置。
➡️

继续阅读