内容提要
2026年4月,Anthropic在支出方面领先,Google在流量方面占优。不同模型适用于不同工作负载,个人助手和后端代理的成本和流量差异显著。生产团队普遍使用超过35种模型,快速适应新版本。AI请求中工具调用比例显著上升,表明应用程序变得更加智能化。
关键要点
-
2026年4月,Anthropic在支出方面占据领先地位,Google在流量方面占优。
-
不同模型适用于不同工作负载,个人助手和后端代理的成本和流量差异显著。
-
生产团队普遍使用超过35种模型,快速适应新版本。
-
AI请求中工具调用比例显著上升,表明应用程序变得更加智能化。
延伸解读
支出与流量的差异
在AI模型的使用中,支出和流量的排名存在显著差异。Anthropic在支出方面领先,而Google则在流量上占优。这表明,不同模型适用于不同的工作负载,用户在选择时需考虑成本与性能的平衡。
多模型使用的趋势
随着AI应用的复杂性增加,生产团队普遍使用超过35种模型。这种多模型架构使得团队能够快速适应新版本,提升了系统的灵活性和可靠性。对于开发者而言,设计时应考虑多模型的整合,以应对未来的变化。
工具调用的增长
AI请求中工具调用的比例显著上升,表明应用程序变得更加智能化。2026年4月,工具调用请求占比达到22.2%,而按令牌计算则高达58.9%。这意味着,未来的AI应用将更加依赖于复杂的工具交互,开发者需关注这一趋势以优化用户体验。
延伸问答
2026年4月,Anthropic和Google在AI网关的表现如何?
2026年4月,Anthropic在支出方面占据领先地位,达到61%,而Google在流量方面占优,38%的流量通过AI网关路由到Google。
不同AI模型在工作负载上的适用性如何?
不同模型适用于不同工作负载,个人助手和后端代理的成本和流量差异显著,个人助手的错误成本较低,因此可以使用便宜的模型。
AI请求中工具调用的比例变化如何?
在2026年4月,AI请求中工具调用的比例显著上升,达到22.2%,而按令牌计算,这一比例更高,达到58.9%。
生产团队通常使用多少种AI模型?
生产团队普遍使用超过35种模型,尤其是在处理超过10M请求的团队中,平均使用35种模型。
AI模型的支出和流量之间有什么关系?
支出和流量之间的关系因工作负载而异,支出通常跟随高风险调用,而流量则跟随低风险调用,不同模型在这两方面的表现不同。
AI网关的请求完成率如何?
大约3.5%的请求在AI网关上完成后进行了回退,意味着初始路由遇到错误后,系统迅速将请求转发到健康的替代方案。