MongoDB ·

使用Voyage AI模型选项实现更低成本的向量检索

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

向量搜索是增强生成系统的首要步骤。通过降维，可以显著降低存储和计算成本。采用Matroyshka表示学习（MRL）可以在不损失准确性的前提下优化检索性能，研究表明512维向量在存储和计算上更具优势，同时保持高准确率。

🎯

🔎

向量的维度直接影响存储和计算成本。使用512维向量相比于2048维向量，存储需求显著降低，且检索准确性相当。这意味着在选择向量表示时，企业可以通过降低维度来节省资源，同时保持系统性能。

Matroyshka表示学习（MRL）通过将向量结构化为类似套娃的形式，优化了向量的存储和计算效率。此方法允许用户在不损失准确性的情况下，选择适合的向量维度，从而提升整体系统性能。

在构建向量检索系统时，选择合适的向量维度和表示方法至关重要。通过实验结果显示，512维向量在存储和计算上更具优势，企业应关注如何利用MRL选项来优化其数据表示，以提高检索效率和降低成本。

❓

向量搜索是增强生成系统的首要步骤，通过将文档转换为向量表示，帮助系统更有效地检索相关信息。

通过将文档表示为较低维度的向量，可以显著减少存储和计算成本，同时保持检索准确性。

MRL是一种将嵌入向量结构化为类似套娃的形式的方法，可以在不损失准确性的前提下缩小向量大小，从而优化检索性能。

Voyage AI的最新文本嵌入模型支持256、512、1024和2048维的输出维度，用户可以根据需要选择合适的表示。

使用512维向量可以在存储成本显著降低的同时，保持与2048维向量相当的检索准确性，提升系统性能。

可以通过分析标准化折扣累积增益（NDCG）和平均倒数排名（MRR）等指标来评估向量检索系统的性能。

🏷️