Spring ·

Spring AI中的AWS Bedrock提示缓存支持

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

AWS Bedrock扩展了对Claude和Nova模型的提示缓存支持，Bedrock的缓存TTL固定为5分钟，而Nova模型不支持工具缓存。Spring AI在两者间保持一致的缓存策略，用户可根据模型可用性和缓存需求选择提供者。

🎯

关键要点

AWS Bedrock扩展了对Claude和Nova模型的提示缓存支持。
Bedrock的缓存TTL固定为5分钟，而Anthropic的直接API提供可选的1小时缓存。
Nova模型不支持工具缓存，使用TOOLS_ONLY或SYSTEM_AND_TOOLS策略会抛出异常。
Spring AI在Claude和Nova模型之间保持一致的缓存策略。
Claude模型支持完整的缓存，包括工具定义，而Nova模型仅支持系统和对话缓存。
模型特定的令牌阈值不同，Claude和Nova模型的最小令牌数各有不同。
AWS Bedrock提供的缓存指标命名与Anthropic直接API不同。
Spring AI在两个提供者之间使用相同的缓存策略。
AWS Bedrock的定价因地区和模型而异，具有约25%的写入溢价和约90%的读取节省。
使用AWS Bedrock的提示缓存可以显著降低API成本和延迟。

🔎

延伸解读

缓存策略的选择

在选择使用AWS Bedrock或Anthropic的Claude模型时，用户需要考虑缓存策略的差异。AWS Bedrock的缓存TTL固定为5分钟，适合高频请求的场景，而Anthropic则提供可选的1小时缓存，适合请求间隔较长的应用。根据具体需求选择合适的模型和缓存策略，可以有效降低API成本和延迟。

Nova模型的局限性

虽然AWS Bedrock扩展了对Nova模型的支持，但用户需注意Nova模型不支持工具缓存。这意味着在使用Nova时，无法利用工具定义进行更复杂的操作，可能限制了某些应用场景的灵活性。因此，在选择模型时，需评估是否需要工具缓存功能。

成本效益分析

使用AWS Bedrock的提示缓存可以显著降低API调用的成本和延迟。根据文章中的示例，使用缓存后，后续请求的费用大幅降低，达到约65%的成本节省。对于频繁调用的应用，合理利用缓存策略将带来显著的经济效益。

❓

延伸问答

AWS Bedrock的提示缓存支持哪些模型？

AWS Bedrock支持Claude模型和Amazon Nova模型。

AWS Bedrock的缓存TTL是多少？

AWS Bedrock的缓存TTL固定为5分钟。

Nova模型与Claude模型在缓存支持上有什么不同？

Nova模型不支持工具缓存，而Claude模型支持完整的缓存，包括工具定义。

使用AWS Bedrock的提示缓存有什么好处？

使用AWS Bedrock的提示缓存可以显著降低API成本和延迟。

Spring AI如何在Claude和Nova模型之间保持一致的缓存策略？

Spring AI在Claude和Nova模型之间使用相同的缓存策略，确保一致性。

AWS Bedrock的定价策略是怎样的？

AWS Bedrock的定价因地区和模型而异，具有约25%的写入溢价和约90%的读取节省。

🏷️