Qdrant 1.15.0版本发布,新增非对称量化及1.5、2位量化,提升精度。文本索引改进支持多语言分词、停用词和词干提取。HNSW优化加速索引构建,Gridstore迁移提高存储效率,MMR重排序增强搜索结果多样性。
本文讨论了Postgres数据库中文本索引的排序方式,介绍了按字节排序的优缺点。按字节排序是指比较字符串中的字节,而不考虑字符的表示。与之相比,语言排序会考虑大小写和其他规则。文章还介绍了如何在索引中使用按字节排序。最后,文章提到了为什么大多数安装不使用按字节排序以及使用C/POSIX的弱点。文章建议在创建数据库时考虑是否需要语言排序,并介绍了C.utf8和内置的C.utf8排序的问题。文章还提到了使用'unicode'或'und-x-icu'排序来实现人类可读的排序。总之,文章认为虽然Postgres具有语言排序的好支持,但并不意味着需要在数据库中的每个文本上使用它们,因此需要考虑使用按字节排序或混合排序的成本。
完成下面两步后,将自动完成登录并继续当前操作。