Vercel News ·

AI网关生产指数

💡 原文英文，约1900词，阅读约需7分钟。

📝

内容提要

2026年4月，Anthropic在支出方面领先，Google在流量方面占优。不同模型适用于不同工作负载，个人助手和后端代理的成本和流量差异显著。生产团队普遍使用超过35种模型，快速适应新版本。AI请求中工具调用比例显著上升，表明应用程序变得更加智能化。

🎯

🔎

在AI模型的使用中，支出和流量的排名存在显著差异。Anthropic在支出方面领先，而Google则在流量上占优。这表明，不同模型适用于不同的工作负载，用户在选择时需考虑成本与性能的平衡。

随着AI应用的复杂性增加，生产团队普遍使用超过35种模型。这种多模型架构使得团队能够快速适应新版本，提升了系统的灵活性和可靠性。对于开发者而言，设计时应考虑多模型的整合，以应对未来的变化。

AI请求中工具调用的比例显著上升，表明应用程序变得更加智能化。2026年4月，工具调用请求占比达到22.2%，而按令牌计算则高达58.9%。这意味着，未来的AI应用将更加依赖于复杂的工具交互，开发者需关注这一趋势以优化用户体验。

❓

2026年4月，Anthropic在支出方面占据领先地位，达到61%，而Google在流量方面占优，38%的流量通过AI网关路由到Google。

不同模型适用于不同工作负载，个人助手和后端代理的成本和流量差异显著，个人助手的错误成本较低，因此可以使用便宜的模型。

在2026年4月，AI请求中工具调用的比例显著上升，达到22.2%，而按令牌计算，这一比例更高，达到58.9%。

生产团队普遍使用超过35种模型，尤其是在处理超过10M请求的团队中，平均使用35种模型。

支出和流量之间的关系因工作负载而异，支出通常跟随高风险调用，而流量则跟随低风险调用，不同模型在这两方面的表现不同。

大约3.5%的请求在AI网关上完成后进行了回退，意味着初始路由遇到错误后，系统迅速将请求转发到健康的替代方案。

🏷️