内容提要
Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型,能够根据查询相关性评分文档。通过Heroku Rerank API,开发者可实现两阶段检索,优化搜索结果并降低成本。该模型在美国和欧盟地区可用,支持每分钟最多250个请求。
关键要点
-
Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型。
-
重排序模型根据查询相关性评分文档,能够识别最相关的文档。
-
通过Heroku Rerank API,开发者可以实现两阶段检索,优化搜索结果。
-
Heroku Managed Inference API与Cohere格式兼容,便于集成重排序功能。
-
开发者可以通过Heroku CLI创建模型并设置环境变量进行重排序。
-
重排序结果返回的对象包含文档的原始位置和相关性评分。
-
top_n参数可以限制返回结果的数量,减少推理成本。
-
这些模型在美国和欧盟地区可用,支持每分钟最多250个请求。
-
Cohere Rerank 3.5的费用为每1000个查询2.00美元,Amazon Rerank 1.0为每1000个查询1.00美元。
-
Heroku提供企业级搜索和检索工具,简化基础设施管理。
延伸问答
Heroku的重排序模型支持哪些版本?
Heroku的重排序模型支持Cohere Rerank 3.5和Amazon Rerank 1.0。
如何通过Heroku Rerank API实现两阶段检索?
通过Heroku Rerank API,开发者可以发送请求到/v1/rerank端点来实现两阶段检索。
Cohere Rerank 3.5和Amazon Rerank 1.0的费用是多少?
Cohere Rerank 3.5的费用为每1000个查询2.00美元,Amazon Rerank 1.0为每1000个查询1.00美元。
Heroku的重排序模型在什么地区可用?
这些模型在美国和欧盟地区可用。
如何使用top_n参数优化重排序结果?
top_n参数可以限制返回结果的数量,从而减少推理成本并保持上下文窗口的清晰。
Heroku Rerank API的请求限制是什么?
Cohere Rerank 3.5支持每分钟最多250个请求,Amazon Rerank 1.0支持每分钟最多200个请求。