Qdrant - Vector Database ·

Qdrant 1.15 - 更智能的量化与更好的文本过滤

💡 原文英文，约1800词，阅读约需7分钟。

📝

内容提要

Qdrant 1.15.0版本发布，新增非对称量化及1.5、2位量化，提升精度。文本索引改进支持多语言分词、停用词和词干提取。HNSW优化加速索引构建，Gridstore迁移提高存储效率，MMR重排序增强搜索结果多样性。

🎯

🔎

Qdrant 1.15引入了1.5位和2位量化技术，显著提高了小向量的精度和压缩比。这对于处理高维数据时，尤其是小型向量的存储和检索效率至关重要。用户在选择量化方式时，应考虑数据特性，以优化存储和查询性能。

新版本的多语言分词功能使得Qdrant能够更好地处理没有明确词边界的语言，如中文和日文。这一改进将提升多语言数据集的搜索一致性，用户在构建多语言应用时，可以更轻松地实现高效的文本检索。

引入的最大边际相关性（MMR）重排序功能，能够在搜索结果中平衡相关性与多样性。这对于需要提供多样化答案的应用场景，如知识助手或文档探索工具，尤其重要。开发者应考虑在相关性与多样性之间找到最佳平衡，以提升用户体验。

❓

Qdrant 1.15版本新增非对称量化、1.5位和2位量化、改进的多语言分词、停用词支持、词干提取和短语匹配等功能。

非对称量化允许存储向量和查询使用不同的编码算法，能够在内存受限的情况下提高精度。

Qdrant 1.15引入了多语言分词功能，支持多种语言的文本索引，提升了多语言数据集的搜索一致性。

MMR重排序通过平衡搜索结果的相关性和多样性，避免返回重复的结果，提升搜索结果的多样性。

升级到Qdrant 1.15版本非常简单，没有重大API或索引破坏性变化，建议逐步升级。

Qdrant 1.15允许用户配置停用词，系统会自动处理无意义的词汇，简化查询构建。

🏷️