Redis Blog ·

技术深潜：利用量化与降维的综合压缩

💡 原文英文，约4500词，阅读约需17分钟。

📝

内容提要

Redis查询引擎现支持量化和降维技术，以优化向量搜索的内存使用，降低成本。与Intel合作采用SVS-VAMANA技术，内存占用减少26-37%，同时保持搜索质量和性能。这一创新有效应对了AI应用中高维嵌入的内存挑战，提升了搜索效率。

🎯

🔎

在AI应用中，高维嵌入的内存占用是一个主要成本因素。Redis通过SVS-VAMANA技术实现了26-37%的内存占用减少，这不仅降低了基础设施成本，还提升了搜索效率。对于需要处理大量向量的企业来说，这种内存优化是实现可持续扩展的关键。

SVS-VAMANA在不同CPU平台上的表现差异显著。在Intel平台上，利用LVQ和LeanVec技术可以获得最佳性能，而在AMD和ARM平台上则可能面临性能下降。因此，选择合适的硬件和算法组合对于实现最佳搜索性能至关重要。

尽管SVS-VAMANA在内存和性能上有显著提升，但在数据摄取时的性能开销仍然较高，尤其是在ARM平台上，可能会导致上传时间显著延长。这表明在选择压缩技术时，需权衡其对整体系统性能的影响。

❓

Redis查询引擎通过支持量化和降维技术，结合SVS-VAMANA技术，减少内存占用26-37%，同时保持搜索质量和性能。

SVS-VAMANA技术结合了Vamana图搜索算法和Intel的压缩技术，显著提高了内存效率、吞吐量和延迟，特别是在高维向量搜索中表现优异。

对于高维向量，建议使用LeanVec技术，而对于低维向量，LVQ技术更为合适。

SVS-VAMANA在保持高准确性的同时，能够显著提高查询的每秒请求数（QPS），并在高并发情况下降低延迟。

Redis的异步向量索引架构通过将插入和删除操作异步处理，提高了写入和读取吞吐量，确保查询的准确性和响应性。

SVS-VAMANA在不同CPU平台上的性能表现不同，Intel平台的表现最佳，而在AMD和ARM平台上则使用回退算法SQ8，性能较低。

🏷️