本文介绍了Google Gemini API的配额模型,包括请求数量和输入令牌的限制。不同模型在免费和付费层级下的限制各不相同,并提供了详细的对比表,以帮助用户了解使用限制。
新推出的提示缓存功能允许开发者重用最近的输入令牌,从而降低成本和延迟,享受50%的折扣和更快的处理速度。
完成下面两步后,将自动完成登录并继续当前操作。