Heroku ·

通过Heroku AI优化搜索精度与重排序

Q: Heroku的重排序模型在什么地区可用？

这些模型在美国和欧盟地区可用。

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型，能够根据查询相关性评分文档。通过Heroku Rerank API，开发者可实现两阶段检索，优化搜索结果并降低成本。该模型在美国和欧盟地区可用，支持每分钟最多250个请求。

🎯

关键要点

Heroku推出支持Cohere Rerank 3.5和Amazon Rerank 1.0的重排序模型。
重排序模型根据查询相关性评分文档，能够识别最相关的文档。
通过Heroku Rerank API，开发者可以实现两阶段检索，优化搜索结果。
Heroku Managed Inference API与Cohere格式兼容，便于集成重排序功能。
开发者可以通过Heroku CLI创建模型并设置环境变量进行重排序。
重排序结果返回的对象包含文档的原始位置和相关性评分。
top_n参数可以限制返回结果的数量，减少推理成本。
这些模型在美国和欧盟地区可用，支持每分钟最多250个请求。
Cohere Rerank 3.5的费用为每1000个查询2.00美元，Amazon Rerank 1.0为每1000个查询1.00美元。
Heroku提供企业级搜索和检索工具，简化基础设施管理。

🔎

延伸解读

重排序模型的优势

Heroku推出的重排序模型能够根据查询的相关性评分文档，提供比传统关键词搜索更精准的结果。这种模型理解语义关系，能够有效减少无关信息，提高搜索效率，适合需要高精度检索的应用场景。

两阶段检索的实现

通过Heroku Rerank API，开发者可以轻松实现两阶段检索。这种方法不仅优化了搜索结果，还能降低推理成本。开发者应关注如何设置环境变量和调用API，以确保模型的高效运行。

区域可用性与请求限制

Cohere Rerank 3.5和Amazon Rerank 1.0在美国和欧盟地区可用，支持每分钟最多250个请求。开发者在设计应用时需考虑这些限制，以确保系统的稳定性和响应速度。

❓

延伸问答

Heroku的重排序模型支持哪些版本？

Heroku的重排序模型支持Cohere Rerank 3.5和Amazon Rerank 1.0。

如何通过Heroku Rerank API实现两阶段检索？

通过Heroku Rerank API，开发者可以发送请求到/v1/rerank端点来实现两阶段检索。

Cohere Rerank 3.5和Amazon Rerank 1.0的费用是多少？

Cohere Rerank 3.5的费用为每1000个查询2.00美元，Amazon Rerank 1.0为每1000个查询1.00美元。

Heroku的重排序模型在什么地区可用？