内容提要
我们推出了rerank-2.5系列,显著提升检索准确性,并首次引入指令跟随功能。该系列在93个数据集上比Cohere Rerank v3.5提高约8%。新功能支持用户通过自然语言调整模型输出的相关性评分,适用于32K令牌上下文长度,便于处理更长文档的检索。
关键要点
-
推出rerank-2.5系列,显著提升检索准确性,首次引入指令跟随功能。
-
在93个数据集上,rerank-2.5和rerank-2.5-lite分别比Cohere Rerank v3.5提高约7.94%和7.16%。
-
新功能允许用户通过自然语言调整模型输出的相关性评分,支持32K令牌上下文长度。
-
rerank-2.5和rerank-2.5-lite在长文档检索中表现更佳,无需截断。
-
指令跟随功能允许用户通过明确指令动态引导重排序过程。
-
用户可以通过自然语言指令定义相关性或指定所需文档特征。
-
在24个领域特定的数据集上,使用指令时,rerank-2.5和rerank-2.5-lite的准确性分别提高8.13%和7.55%。
-
评估使用了9个领域的标准数据集,涵盖技术文档、法律、金融等。
-
rerank-2.5在相同价格下比rerank-2提高1.85%,而rerank-2.5-lite比rerank-2-lite提高3.40%。
-
在真实世界应用中,使用指令时,rerank-2.5和rerank-2.5-lite的准确性分别提高11.48%和7.83%。
-
rerank-2.5和rerank-2.5-lite在所有第一阶段检索方法上均表现优异。
-
新用户可享受前200M令牌免费,结合Voyage嵌入模型和Voyage重排序器可实现最高检索准确性。
延伸解读
指令跟随功能的实用性
rerank-2.5系列引入的指令跟随功能,使用户能够通过自然语言指令来调整检索结果的相关性。这一功能特别适用于用户意图复杂的检索任务,能够显著提高检索的准确性。用户可以根据具体需求,灵活定义所需文档的特征,从而优化检索结果。
长文档检索的优势
rerank-2.5和rerank-2.5-lite支持32K令牌的上下文长度,允许处理更长的文档而无需截断。这一特性在需要检索长篇文献或技术文档时尤为重要,能够提升信息检索的全面性和准确性,适合多种应用场景。
与竞争产品的比较
在多个数据集的评估中,rerank-2.5系列在检索准确性上均优于Cohere Rerank v3.5和其他竞争产品。这表明,rerank-2.5系列在性能和性价比上设立了新的标杆,尤其适合需要高效检索的用户群体。
延伸问答
rerank-2.5系列的主要功能是什么?
rerank-2.5系列显著提升了检索准确性,并首次引入了指令跟随功能。
rerank-2.5和rerank-2.5-lite在准确性上有何提升?
在93个数据集上,rerank-2.5和rerank-2.5-lite分别比Cohere Rerank v3.5提高约7.94%和7.16%。
指令跟随功能如何影响检索结果?
指令跟随功能允许用户通过自然语言调整模型输出的相关性评分,从而提高检索准确性。
rerank-2.5支持的上下文长度是多少?
rerank-2.5和rerank-2.5-lite支持32K令牌的上下文长度。
使用指令时,rerank-2.5的准确性提升了多少?
在真实世界应用中,使用指令时,rerank-2.5的准确性提高了11.48%。
新用户如何使用rerank-2.5系列?
新用户可以享受前200M令牌免费,并结合Voyage嵌入模型和Voyage重排序器实现最高检索准确性。