Vercel News ·

通过AI Gateway访问实时模型性能指标

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

AI Gateway提供数百个模型的实时吞吐量和延迟指标，帮助用户选择合适的模型。指标每小时更新，用户可在模型列表和详细页面查看最佳P50性能，并通过REST API进行程序化访问。

🎯

🔎

AI Gateway提供的实时吞吐量和延迟指标对于用户选择合适的模型至关重要。通过每小时更新的数据，用户可以及时了解不同模型的性能变化，从而做出更明智的决策，避免因使用性能不佳的模型而导致的效率低下。

在模型详细页面中，用户可以查看各个提供商的P50延迟和吞吐量。这种比较功能使得用户能够根据具体需求选择最佳的模型提供商，尤其是在对延迟和吞吐量有严格要求的应用场景中，能够显著提升用户体验。

通过REST API，用户可以实现对模型性能指标的程序化访问。这种灵活性使得开发者能够将实时数据集成到自己的应用中，自动化监控和优化模型选择，提升整体工作效率。

❓

AI Gateway提供数百个模型的实时吞吐量和延迟指标，帮助用户选择合适的模型。

用户可以在模型列表和详细页面查看每个模型的最佳P50性能，指标每小时更新。

用户可以通过REST API获取指定模型的实时P50和P95延迟及吞吐量，使用特定的API端点进行查询。

模型列表中包含可排序的延迟和吞吐量列，用户可以根据需要找到最快的令牌生成模型或最快的首次令牌时间模型。

用户可以在模型详细页面查看每个提供商的P50延迟和吞吐量，从而比较不同提供商的性能。

AI Gateway的指标每小时更新，确保用户获取最新的性能数据。

🏷️