加钱就能变得更强!Gemini API推出优先选项 贵80%但可以优先调用

💡 原文中文,约1400字,阅读约需4分钟。
📝

内容提要

谷歌Gemini API平台新增优先级和Flex层,开发者可根据需求选择不同的价格和延迟服务。优先级层提供更快的算力,Flex层适合非实时任务。新模式引发争议,部分开发者担心中小企业受损。

🎯

关键要点

  • 谷歌Gemini API平台新增优先级和Flex层,开发者可根据需求选择不同的价格和延迟服务。

  • 优先级层提供更快的算力,价格为标准层的75%~100%,适合实时和关键业务场景。

  • Flex层价格为标准层的50%,适合后台和非实时任务,但延迟时间不保证,可能出现消息丢失。

  • 开发者可以通过智能重试逻辑在不同层级之间切换,以实现成本最小化。

  • 部分开发者担心新模式可能会损害中小企业的利益,优先级层可能导致算力分配不均。

  • 新层级目前仅在Gemini 3 Flash Preview模型中测试,未来将扩展到更多模型,且仅限Tier 2/3及以上等级的开发者使用。

延伸问答

Gemini API的优先级层有什么特点?

优先级层价格为标准层的75%~100%,提供极低的延迟,适合实时和关键业务场景。

Flex层适合什么样的任务?

Flex层价格为标准层的50%,适合后台和非实时任务,但延迟时间不保证,可能出现消息丢失。

开发者如何在不同层级之间切换以降低成本?

开发者可以使用智能重试逻辑,先尝试Flex层,如果延迟过长再切换到标准层,最后如有必要再切换到优先级层。

新层级的推出对中小企业有什么影响?

部分开发者担心新模式可能损害中小企业利益,因为优先级层可能导致算力分配不均。

Gemini API的不同层级目前在哪些模型中测试?

新层级目前仅在Gemini 3 Flash Preview模型中测试,未来将扩展到更多模型。

开发者如何使用Gemini API的不同层级?

开发者需在模型调用代码中新增指令,且仅限Tier 2/3及以上等级的开发者使用。

➡️

继续阅读