Databricks ·

设计解耦：亿级向量搜索

💡 原文英文，约2900词，阅读约需11分钟。

📝

内容提要

Databricks重新设计了向量搜索系统，以应对从百万到十亿向量的数据集扩展问题。新系统提供标准和存储优化两种部署选项，后者通过分离存储与计算，降低成本和延迟。采用反向文件索引和产品量化等技术，使索引构建速度提高20倍，服务成本降低7倍，适用于语义搜索和推荐系统等应用。

🎯

🔎

Databricks的新系统通过将存储与计算分离，显著降低了成本和延迟。这种解耦设计使得系统能够处理超过十亿个向量，适应大规模数据集的需求。对于需要高并发处理的应用场景，这种架构提供了更好的扩展性和灵活性。

采用反向文件索引和产品量化等技术，使得索引构建速度提高20倍，服务成本降低7倍。这些技术的选择不仅提升了系统性能，也为语义搜索和推荐系统等应用提供了更高的成本效益，适合大规模数据处理。

虽然新系统在处理大规模数据时表现出色，但查询延迟相较于标准端点有所增加。对于对延迟敏感的应用，标准向量搜索仍然是更优选择。因此，用户在选择部署选项时需根据具体需求权衡延迟与成本。

❓

Databricks重新设计了向量搜索系统，提供标准和存储优化两种部署选项，存储优化通过分离存储与计算来降低成本和延迟。

存储优化向量搜索采用反向文件索引和产品量化技术，使索引构建速度提高20倍，服务成本降低7倍，支持超过十亿个768维向量的索引。

新系统提供更高的成本效益和扩展性，适用于语义搜索和推荐系统等应用，能够处理亿级向量数据。

产品量化技术将768维向量压缩至48字节，显著减少了内存占用和存储成本。

新架构通过将数据存储在云对象存储中，解耦存储与计算，从而提升了系统的可扩展性。

查询引擎采用Rust编写，优化了查询延迟，确保了高并发请求的处理能力。

🏷️