Planet PostgreSQL ·

彼得·艾森特劳特：排序规则的工作原理

💡 原文英文，约1600词，阅读约需6分钟。

📝

内容提要

本文讨论PostgreSQL内部的排序规则，以及PostgreSQL 15和16中的改进。排序的两个主要方面是排序算法和排序规则，排序规则围绕Unicode标准展开，其他字符编码也仍在使用，但排序规则都是以Unicode为基础定义的。

🎯

关键要点

本文讨论PostgreSQL内部的排序规则及其在PostgreSQL 15和16中的改进。
排序的两个主要方面是排序算法和排序规则，排序规则基于Unicode标准。
排序在数据库系统中是重要的功能，涉及内部和外部的排序过程。
排序文本以满足最终用户的需求是关键，用户希望看到排序后的文本列表。
存在行业标准和政府标准，当前主要围绕Unicode进行定义。
Unicode标准定义了字符及其属性，UTS #10指定了排序的工作方式。
ISO/IEC标准与Unicode标准相似，便于在ISO/IEC领域创建其他标准。
UCA定义了默认排序顺序DUCET，适用于多种语言的文本。
CLDR是维护多种语言和变体自定义的公共区域数据存储库。
在UCA中，每个字符被分配三个值（权重），用于比较字符串。
通过连接字符的权重，可以生成排序键进行比较。
可以通过自定义设置调整排序规则，例如区分大小写或忽略重音符。
PostgreSQL文档提供了关于排序规则的详细参考，便于用户理解。
未来将讨论标点符号、空格等如何处理的问题。

🏷️

标签

PostgreSQL Unicode 字符编码排序排序规则

➡️

继续阅读

【WireGuard】协议原理：Noise IKpsk2、四次 DH 与 Cookie
对齐 wireguard.com/protocol 与 NDSS 2017：IKpsk2 消息布局、es/ss/ee/se 四次 DH 的安全贡献、1.5...
I hate that I don’t hate this song made with Suno
I would never go so far as to say there's no place for AI in music (I'...
The FBI reportedly won’t investigate ICE anymore
According to the The New York Times, federal agents have been told that the F...
Henrietta Dombrovskaya: Prairie Postgres July Meetup: Proudly Sourced at Midwest!
On July 15, we hosted the second meetup at our new location, the Chicago Inno...
Spark 4.2 has a feature that could retire your vector database
Apache Spark 4.2 launched last week, and it signals an expansion of Spark’s d...
《旧梦》
《旧梦》前世辗转复缠绵，今生相逢缘已浅。红尘旧梦忽惊起，枕边旧人换新人。 -- 2026071...