Voyage AI ·

介绍 voyage-context-3：全球文档上下文下的聚焦块级细节

💡 原文英文，约1700词，阅读约需7分钟。

📝

内容提要

我们推出了voyage-context-3模型，通过上下文化的块嵌入提升文档检索的准确性。在块级和文档级检索任务中，分别比OpenAI-v3-large和Cohere-v4提高了14.24%和12.56%。该模型简化了技术堆栈，降低了存储成本，支持多维度和量化选项，适用于长文档和高敏感度检索任务。

🎯

🔎

voyage-context-3模型在文档检索中表现出色，尤其适用于长文档和高敏感度的检索任务，如法律和医疗领域。其上下文化的块嵌入能够同时捕捉细节和全局上下文，提升检索的准确性，减少了对手动元数据的依赖。

该模型在存储成本和检索性能之间实现了良好的平衡。通过支持多种嵌入维度和量化选项，voyage-context-3在保持高检索准确率的同时，显著降低了向量数据库的存储成本，适合资源有限的应用场景。

voyage-context-3对块划分策略的敏感性较低，这意味着用户在处理小块时可以获得更稳定的检索性能。这一特性使得模型在实际应用中更加灵活，能够适应不同的数据和任务需求。

❓

voyage-context-3模型通过上下文化的块嵌入提升文档检索的准确性，简化了技术堆栈，降低了存储成本，并支持多维度和量化选项。

在块级和文档级检索任务中，voyage-context-3分别比OpenAI-v3-large和Cohere-v4提高了14.24%和12.56%。

该模型能够捕捉完整文档的上下文，无需手动提供元数据，从而提高检索性能。

voyage-context-3在检索性能上优于传统的上下文无关嵌入模型，能够同时捕捉细节和全局上下文。

voyage-context-3支持2048、1024、512和256维的嵌入，并提供多种量化选项，包括32位浮点和8位整数。

该模型特别适用于长的非结构化文档，如白皮书、法律合同和研究报告。

🏷️