小红花·文摘

Qdrant 1.15 - 更智能的量化与更好的文本过滤

Qdrant - Vector Database ·

本文讨论了Postgres数据库中文本索引的排序方式，介绍了按字节排序的优缺点。按字节排序是指比较字符串中的字节，而不考虑字符的表示。与之相比，语言排序会考虑大小写和其他规则。文章还介绍了如何在索引中使用按字节排序。最后，文章提到了为什么大多数安装不使用按字节排序以及使用C/POSIX的弱点。文章建议在创建数据库时考虑是否需要语言排序，并介绍了C.utf8和内置的C.utf8排序的问题。文章还提到了使用'unicode'或'und-x-icu'排序来实现人类可读的排序。总之，文章认为虽然Postgres具有语言排序的好支持，但并不意味着需要在数据库中的每个文本上使用它们，因此需要考虑使用按字节排序或混合排序的成本。

丹尼尔·维里特：使用按字节排序的索引

Planet PostgreSQL ·