rerank-2.5 和 rerank-2.5-lite:指令跟随重排序器

rerank-2.5 和 rerank-2.5-lite:指令跟随重排序器

💡 原文英文,约1800词,阅读约需7分钟。
📝

内容提要

我们推出了rerank-2.5系列,显著提升检索准确性,并首次引入指令跟随功能。该系列在93个数据集上比Cohere Rerank v3.5提高约8%。新功能支持用户通过自然语言调整模型输出的相关性评分,适用于32K令牌上下文长度,便于处理更长文档的检索。

🎯

关键要点

  • 推出rerank-2.5系列,显著提升检索准确性,首次引入指令跟随功能。

  • 在93个数据集上,rerank-2.5和rerank-2.5-lite分别比Cohere Rerank v3.5提高约7.94%和7.16%。

  • 新功能允许用户通过自然语言调整模型输出的相关性评分,支持32K令牌上下文长度。

  • rerank-2.5和rerank-2.5-lite在长文档检索中表现更佳,无需截断。

  • 指令跟随功能允许用户通过明确指令动态引导重排序过程。

  • 用户可以通过自然语言指令定义相关性或指定所需文档特征。

  • 在24个领域特定的数据集上,使用指令时,rerank-2.5和rerank-2.5-lite的准确性分别提高8.13%和7.55%。

  • 评估使用了9个领域的标准数据集,涵盖技术文档、法律、金融等。

  • rerank-2.5在相同价格下比rerank-2提高1.85%,而rerank-2.5-lite比rerank-2-lite提高3.40%。

  • 在真实世界应用中,使用指令时,rerank-2.5和rerank-2.5-lite的准确性分别提高11.48%和7.83%。

  • rerank-2.5和rerank-2.5-lite在所有第一阶段检索方法上均表现优异。

  • 新用户可享受前200M令牌免费,结合Voyage嵌入模型和Voyage重排序器可实现最高检索准确性。

🔎

延伸解读

指令跟随功能的实用性

rerank-2.5系列引入的指令跟随功能,使用户能够通过自然语言指令来调整检索结果的相关性。这一功能特别适用于用户意图复杂的检索任务,能够显著提高检索的准确性。用户可以根据具体需求,灵活定义所需文档的特征,从而优化检索结果。

长文档检索的优势

rerank-2.5和rerank-2.5-lite支持32K令牌的上下文长度,允许处理更长的文档而无需截断。这一特性在需要检索长篇文献或技术文档时尤为重要,能够提升信息检索的全面性和准确性,适合多种应用场景。

与竞争产品的比较

在多个数据集的评估中,rerank-2.5系列在检索准确性上均优于Cohere Rerank v3.5和其他竞争产品。这表明,rerank-2.5系列在性能和性价比上设立了新的标杆,尤其适合需要高效检索的用户群体。

延伸问答

rerank-2.5系列的主要功能是什么?

rerank-2.5系列显著提升了检索准确性,并首次引入了指令跟随功能。

rerank-2.5和rerank-2.5-lite在准确性上有何提升?

在93个数据集上,rerank-2.5和rerank-2.5-lite分别比Cohere Rerank v3.5提高约7.94%和7.16%。

指令跟随功能如何影响检索结果?

指令跟随功能允许用户通过自然语言调整模型输出的相关性评分,从而提高检索准确性。

rerank-2.5支持的上下文长度是多少?

rerank-2.5和rerank-2.5-lite支持32K令牌的上下文长度。

使用指令时,rerank-2.5的准确性提升了多少?

在真实世界应用中,使用指令时,rerank-2.5的准确性提高了11.48%。

新用户如何使用rerank-2.5系列?

新用户可以享受前200M令牌免费,并结合Voyage嵌入模型和Voyage重排序器实现最高检索准确性。

🏷️

标签

➡️

继续阅读