Voyage AI ·

voyage-3-large：新一代通用嵌入模型的最先进技术

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

voyage-3-large是一种新型多语言嵌入模型，在100个数据集的八个领域中表现优异，超越OpenAI-v3-large和Cohere-v3-English。该模型通过Matryoshka学习和量化训练，支持小维度和低存储成本，检索质量几乎不受影响，提供更高的灵活性和效率。

🎯

🔎

voyage-3-large在多个领域的表现优异，尤其在法律、金融和技术文档等专业领域。其高效的检索能力使其适用于需要快速获取信息的应用场景，如法律咨询和金融分析。用户可以利用该模型提升信息检索的准确性和效率，尤其是在多语言环境中。

voyage-3-large通过量化训练显著降低了存储成本，使用int8精度时存储成本减少8倍，且检索质量几乎不受影响。这对于资源有限的企业尤为重要，能够在保证性能的同时，降低运营成本。用户在选择模型时应关注存储与性能的平衡，以优化资源配置。

使用二进制嵌入进行文档检索后，voyage-3-large的二进制重评分可提高检索质量达5.84%。这一特性使得用户在初步检索后，能够通过重评分进一步提升结果的准确性，适合需要高精度检索的应用场景。

❓

voyage-3-large在100个数据集的八个领域中表现优异，超越OpenAI-v3-large和Cohere-v3-English，平均提升9.74%和20.71%。

使用int8精度和1024维度的voyage-3-large存储成本减少8倍，且检索质量仅下降0.31%。

在512维的二进制嵌入中，voyage-3-large仍然比OpenAI-v3-large表现更好，存储成本减少200倍。

Matryoshka学习和量化训练使voyage-3-large支持小维度和低存储成本，同时检索质量几乎不受影响。

voyage-3-large在各个领域的检索质量均优于voyage-3和voyage-3-lite，平均提升4.14%、7.68%和9.74%。

使用二进制重评分后，voyage-3-large的检索质量可提高达5.84%。

🏷️