通过Heroku AI优化搜索精度与重排序

通过Heroku AI优化搜索精度与重排序

💡 原文英文,约600词,阅读约需2分钟。
📝

内容提要

Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型,能够根据查询相关性评分文档。通过Heroku Rerank API,开发者可实现两阶段检索,优化搜索结果并降低成本。该模型在美国和欧盟地区可用,支持每分钟最多250个请求。

🎯

关键要点

  • Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型。

  • 重排序模型根据查询相关性评分文档,能够识别最相关的文档。

  • 通过Heroku Rerank API,开发者可以实现两阶段检索,优化搜索结果。

  • Heroku Managed Inference API与Cohere格式兼容,便于集成重排序功能。

  • 开发者可以通过Heroku CLI创建模型并设置环境变量进行重排序。

  • 重排序结果返回的对象包含文档的原始位置和相关性评分。

  • top_n参数可以限制返回结果的数量,减少推理成本。

  • 这些模型在美国和欧盟地区可用,支持每分钟最多250个请求。

  • Cohere Rerank 3.5的费用为每1000个查询2.00美元,Amazon Rerank 1.0为每1000个查询1.00美元。

  • Heroku提供企业级搜索和检索工具,简化基础设施管理。

延伸问答

Heroku的重排序模型支持哪些版本?

Heroku的重排序模型支持Cohere Rerank 3.5和Amazon Rerank 1.0。

如何通过Heroku Rerank API实现两阶段检索?

通过Heroku Rerank API,开发者可以发送请求到/v1/rerank端点来实现两阶段检索。

Cohere Rerank 3.5和Amazon Rerank 1.0的费用是多少?

Cohere Rerank 3.5的费用为每1000个查询2.00美元,Amazon Rerank 1.0为每1000个查询1.00美元。

Heroku的重排序模型在什么地区可用?

这些模型在美国和欧盟地区可用。

如何使用top_n参数优化重排序结果?

top_n参数可以限制返回结果的数量,从而减少推理成本并保持上下文窗口的清晰。

Heroku Rerank API的请求限制是什么?

Cohere Rerank 3.5支持每分钟最多250个请求,Amazon Rerank 1.0支持每分钟最多200个请求。

➡️

继续阅读